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Annexe 
Programme de l’enseignement spécifique et de spécialité de mathématiques 
Classe terminale de la série scientifique 


L’enseignement des mathématiques au collège et au lycée a pour but de donner à chaque élève la culture 
mathématique indispensable pour sa vie de citoyen et les bases nécessaires à son projet de poursuite d’études. 

Le cycle terminal de la série S procure un bagage mathématique solide aux élèves désireux de s’engager dans des 
études supérieures scientifiques, en les formant à la pratique d’une démarche scientifique et en renforçant leur goût 
pour des activités de recherche. 

L’apprentissage des mathématiques cultive des compétences qui facilitent une formation tout au long de la vie et 
aident à mieux appréhender une société en évolution. Au-delà du cadre scolaire, il s’inscrit dans une perspective de 
formation de l’individu. 


Objectif général 

Outre l’apport de nouvelles connaissances, le programme vise le développement des compétences suivantes : 
e mettre en œuvre une recherche de façon autonome ; 

e mener des raisonnements ; 

e avoir une attitude critique vis-à-vis des résultats obtenus ; 

e communiquer à l’écrit et à l’oral. 


Raisonnement et langage mathématiques 


Comme en classe de seconde, les capacités d’argumentation, de rédaction d’une démonstration et de logique font 
partie intégrante des exigences du cycle terminal. 

Les concepts et méthodes relevant de la logique mathématique ne font pas l’objet de cours spécifiques mais prennent 
naturellement leur place dans tous les champs du programme. Il importe toutefois de prévoir des moments 
d’institutionnalisation de certains concepts ou types de raisonnement, après que ceux-ci ont été rencontrés plusieurs 
fois en situation. 

De même, le vocabulaire et les notations mathématiques ne sont pas fixés d’emblée, mais sont introduits au cours du 
traitement d’une question en fonction de leur utilité. 


Il convient de prévoir des temps de synthèse, l’objectif étant que ces éléments soient maîtrisés en fin de cycle terminal. 


Utilisation d’outils logiciels 

L'utilisation de logiciels, d’outils de visualisation et de simulation, de calcul (formel ou scientifique) et de 
programmation change profondément la nature de l’enseignement en favorisant une démarche d’investigation. 

En particulier lors de la résolution de problèmes, l’utilisation de logiciels de calcul formel limite le temps consacré à 
des calculs très techniques afin de se concentrer sur la mise en place de raisonnements. 

L'utilisation de ces outils intervient selon trois modalités : 

e par le professeur, en classe, avec un dispositif de visualisation collective ; 

e par les élèves, sous forme de travaux pratiques de mathématiques ; 

e dans le cadre du travail personnel des élèves hors de la classe. 


Diversité de l’activité de l’élève 

Les activités proposées en classe et hors du temps scolaire prennent appui sur la résolution de problèmes purement 
mathématiques ou issus d’autres disciplines. De nature diverse, elles doivent entraîner les élèves à : 

chercher, expérimenter, modéliser, en particulier à l’aide d’outils logiciels ; 

choisir et appliquer des techniques de calcul ; 

mettre en œuvre des algorithmes ; 

raisonner, démontrer, trouver des résultats partiels et les mettre en perspective ; 

expliquer oralement une démarche, communiquer un résultat par oral ou par écrit. 


Des éléments d’épistémologie et d’histoire des mathématiques s’insèrent naturellement dans la mise en œuvre du 
programme. Connaître le nom de quelques mathématiciens célèbres, la période à laquelle ils ont vécu et leur 
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contribution fait partie intégrante du bagage culturel de tout élève ayant une formation scientifique. La présentation de 
textes historiques aide à comprendre la genèse et l’évolution de certains concepts. 

Fréquents, de longueur raisonnable et de nature variée, les travaux hors du temps scolaire contribuent à la formation 
des élèves et sont absolument essentiels à leur progression. Ils sont conçus de façon à prendre en compte la diversité et 
l’hétérogénéité de leurs aptitudes. 

Les modes d’évaluation prennent également des formes variées, en phase avec les objectifs poursuivis. En particulier, 
l’aptitude à mobiliser l’outil informatique dans le cadre de la résolution de problèmes est à évaluer. 


Organisation du programme 

Le programme fixe les objectifs à atteindre en termes de capacités. Il est conçu pour favoriser une acquisition 
progressive des notions et leur pérennisation. Son plan n’indique pas la progression à suivre. 

À titre indicatif, on pourrait consacrer la moitié du temps à l’analyse, l’autre moitié se répartissant équitablement entre 
géométrie et probabilités-statistique. 

Les capacités attendues indiquent un niveau minimal de maîtrise des contenus en fin de cycle terminal. La formation 
ne s’y limite pas. 

Les capacités attendues dans le domaine de l’algorithmique d’une part et du raisonnement d’autre part sont rappelées 
en fin de programme. Elles doivent être exercées à l’intérieur de chaque champ du programme. 

Plusieurs démonstrations, ayant valeur de modèle, sont repérées par le symbole &. Certaines sont exigibles et 
correspondent à des capacités attendues. 

De même, les activités de type algorithmique sont signalées par le symbole ©. 

Les commentaires notés $ distinguent des thèmes pouvant se prêter à des ouvertures interdisciplinaires, en 
concertation avec les professeurs d’autres disciplines scientifiques. 

Quelques propositions d’approfondissement, destinées à des activités dans le cadre de l’accompagnement 
personnalisé, figurent en italique avec la mention GP) 
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1. Analyse 


Comme dans les classes précédentes, l’activité mathématique est motivée par la résolution de problèmes. L’un des 
objectifs du programme est de permettre à l’élève, par une consolidation et un enrichissement des notions relatives aux 
suites et aux fonctions, d’étudier un plus grand nombre de phénomènes discrets ou continus. 


La notion de limite de suite fait l’objet d’une étude approfondie. On prépare ainsi la présentation des limites de 


fonctions. 


L’ensemble des fonctions mobilisables est élargi par l’introduction des fonctions exponentielle, logarithme, sinus et 
cosinus. La fonction exponentielle intervenant dans différents champs du programme, il est souhaitable de l’introduire 


assez tôt dans l’année. 


Enfin, s’ajoute le nouveau concept d’intégration qui, bien que modestement abordé et développé, demeure un concept 


fondamental de l’analyse. 


L’acquisition d’automatismes de calcul demeure un objectif du programme, cependant, dans le cadre de la résolution 
de problèmes, on a recours si besoin à un logiciel de calcul formel ou scientifique. 


Suites 


Raisonnement par récurrence. 


Limite finie ou infinie d’une 
suite. 


Limites et comparaison. 


e Savoir mener un raisonnement par 
récurrence. 


© Dans le cas d’une limite infinie, étant 
donnés une suite croissante (4, ) et un 
nombre réel 4, déterminer à l’aide d’un 
algorithme un rang à partir duquel 

u, est supérieur à À. 


Démontrer que si (u, )et(v,) sont 

deux suites telles que : 

- u, est inférieur ou égal à v, à partir 
d’un certain rang ; 

- u, tend vers + quand n tend vers 
+ 00 ; 


alors v, tend vers + quand n tend 
Vers +00. 


Ce type de raisonnement intervient tout au 
long de l’année et pas seulement dans le 
cadre de l’étude des suites. 


Pour exprimer que u, tend vers / quand n 


tend vers +0, on dit que : « tout intervalle 
ouvert contenant / contient toutes les 
valeurs 4, à partir d’un certain rang ». 


Pour exprimer que uw, tend vers + quand 


n tend vers +0, on dit que : « tout 
intervalle de la forme ]4,+00 [ contient 


toutes les valeurs #, à partir d’un certain 
rang ». 


Comme en classe de première, il est 
important de varier les approches et les 
outils sur lesquels le raisonnement s’appuie. 


On présente des exemples de suites qui 
n’ont pas de limite. 


On démontre que si une suite est 
croissante et admet pour limite /, alors tous 
les termes de la suite sont inférieurs ou 
égaux à /. 


Le théorème dit « des gendarmes » est 
admis. 
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Opérations sur les limites. 


Comportement à l’infini de la 
suite (g”), g étant un nombre 
réel. 


Suite majorée, minorée, 
bornée. 


Limites de fonctions 

Limite finie ou infinie d’une 
fonction à l’infini. 

Limite infinie d’une fonction 


en un point. 


Limite d’une somme, d’un 
produit, d’un quotient ou 
d’une composée de deux 
fonctions. 


Limites et comparaison. 


Asymptote parallèle à l’un 
des axes de coordonnées. 


e Étudier la limite d’une somme, d’un 
produit ou d’un quotient de deux suites. 


Démontrer que la suite (g” ), avec 
g >1,a pour limite +0. 


e Déterminer la limite éventuelle d’une 
suite géométrique. 


e Utiliser le théorème de convergence 
des suites croissantes majorées. 


e Déterminer la limite d’une somme, 
d’un produit, d’un quotient ou d’une 
composée de deux fonctions. 


e Déterminer des limites par 
minoration, majoration et encadrement. 


e Interpréter graphiquement les limites 
obtenues. 


On démontre par récurrence que pour a réel 
strictement positif et tout entier naturel n : 


(+a)" >1+na. 


On peut étudier des situations où intervient 
la limite de la somme des premiers termes 
d’une suite géométrique. 


Ce théorème est admis. 


Il est intéressant de démontrer qu’une 
suite croissante non majorée a pour limite 
+0. 


Des exemples de suites récurrentes, en 
particulier arithmético-géométriques, sont 
traités en exercice. 


© Des activités algorithmiques sont menées 
dans ce cadre. 


Approximations de réels (n, e, nombre d'or, 
etc.). 


Le travail réalisé sur les suites est étendu 
aux fonctions, sans formalisation excessive. 
L'objectif essentiel est de permettre aux 
élèves de s’approprier le concept de limite, 
tout en leur donnant les techniques de base 
pour déterminer des limites dans les 
exemples rencontrés en terminale. 


La composée de deux fonctions est 
rencontrée à cette occasion, mais sans 
théorie générale. 
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Continuité sur un On se limite à une approche intuitive de la 
intervalle, théorème des continuité et on admet que les fonctions 
valeurs intermédiaires usuelles sont continues par intervalle. 
On présente quelques exemples de 
fonctions non continues, en particulier issus 
de situations concrètes. 


Le théorème des valeurs intermédiaires est 
admis. 

On convient que les flèches obliques d’un 
tableau de variation traduisent la continuité 
et la stricte monotonie de la fonction sur 
l’intervalle considéré. 


On admet qu’une fonction dérivable sur un 
intervalle est continue sur cet intervalle. 


e Exploiter le théorème des valeurs | Ce cas particulier est étendu au cas où f est 


intermédiaires dans le cas où la | définie sur un intervalle ouvert ou semi- 
fonction est strictement monotone, pour ouvert, borné ou non, les limites de f aux 


Calculs de dérivées : 
compléments 


résoudre un problème donné. 


e Calculer les dérivées des fonctions : 


x Ju(x) ; 
xh (u(x))" , n entier relatif non nul ; 
xbe*® ; 


xh In(u(x)). 


e Calculer la dérivée d’une fonction 
x f(ax+b) où f est une fonction 


dérivable, a et b deux nombres réels. 


bornes de l’intervalle étant supposées 
connues. 


© Des activités algorithmiques sont 
réalisées dans le cadre de la recherche de 
solutions de l’équation f(x) =. 


À partir de ces exemples, on met en 
évidence une expression unifiée de la 
dérivée de la fonction x+> f{u(x)), mais 
sa connaissance n’est pas une capacité 
attendue. 


Les techniques de calcul sont à travailler 
mais ne doivent pas être un frein à la 
résolution de problèmes. On a recours si 
besoin à un logiciel de calcul formel. 


Exemples de fonctions discontinues, ou à dérivées 


non continues. 
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Fonctions sinus et cosinus e Connaître la dérivée des fonctions On fait le lien entre le nombre dérivé de la 
sinus et cosinus. fonction sinus en 0 et la limite en 0 de 
sin x 
+ 
e Connaître quelques propriétés de ces | En dehors des exemples étudiés, aucun 
fonctions, notamment parité et développement n’est attendu sur les notions 
périodicité. de périodicité et de parité. 
e Connaître les représentations On fait le lien entre les résultats obtenus en 
graphiques de ces fonctions. utilisant le cercle trigonométrique et les 


représentations graphiques des fonctions 
XxH cos x et x sinx. 


$S [SPC] Ondes progressives sinusoïdales, 
oscillateur mécanique. 


Fonction exponentielle 


Fonction x + exp(x). Démontrer l’unicité d’une fonction La fonction exponentielle est présentée 
dérivable sur R, égale à sa dérivée et qui | comme l’unique fonction f dérivable sur R 


vaut l en 0. telle que: f"= f et f(0)=1. 
L'existence est admise. 


Relation fonctionnelle, Démontrer que lim e° =+0 et On étudie des exemples de fonctions de la 
hotatoit € is forme x+ exp(u(x)) ,notamment avec 
‘ lim e* =0. ; 
x -00 u(x)=-kx où u(x)=-kx?(k> 0), qui 
sont utilisées dans des domaines variés. 
e Utiliser la relation fonctionnelle pour 
transformer une écriture. On fait le lien entre le nombre dérivé de la 
fonction exponentielle en 0 et la limite en 0 
e Connaître le sens de variation et la e*-1 
représentation graphique de la fonction | de 


. + 
exponentielle. 


X 


e Connaître et exploiter lim —=+x |+ [SPC et SVT] Radioactivité. 


XD+0 % 


et lim xe —0. GP) Évude de phénomènes d'évolution. 


X— —00 
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Fonction logarithme 
népérien 


e Connaître le sens de variation, les 
limites et la représentation graphique de 
la fonction logarithme népérien. 


Fonction x+->Inx. 


e Utiliser, pour a réel strictement 
positif et b réel, l’équivalence 


Relation fonctionnelle, 
dérivée. 


na=b&a=e?. 


e Utiliser la relation fonctionnelle pour 
tansformer une écriture. 


à ; .. nx 
e Connaître et exploiter lim —— 
XD+0  % 


Intégration 


Définition de l’intégrale 
d’une fonction continue et 
positive sur [ab] comme aire 


sous la courbe. 


b 
Notation [ | f(x)dx. 


Théorème : si f est une 
fonction continue et positive 
sur [ab], la fonction F 


définie sur [ab] 
par F(x) = [ ftodt 


est dérivable sur [a, b] et a 
pour dérivée f. 


On peut introduire la fonction logarithme 
népérien grâce aux propriétés de la fonction 
exponentielle ou à partir de l’équation 
fonctionnelle. 


On souligne dans les cadres algébrique et 
graphique que les fonctions logarithme 
népérien et exponentielle sont réciproques 
l’une de l’autre. Tout développement 
théorique sur les fonctions réciproques est 
exclu. 


On fait le lien entre le nombre dérivé de la 
fonction logarithme en 1 et la limite en 0 de 
In(1 + x) 

0 
On évoque la fonction logarithme décimal 
pour son utilité dans les autres disciplines. 


S [SI] Gain lié à une fonction de transfert. 
$S [SPC] Intensité sonore, magnitude d’un 
séisme, échelle des pH. 


Équations fonctionnelles. 


On s’appuie sur la notion intuitive d’aire 
rencontrée au collège et sur les propriétés 
d’additivité et d’invariance par translation 
et symétrie. 


On peut mener un calcul approché d’aire 
(parabole, hyperbole, etc.) pour illustrer 
cette définition. 


Il est intéressant de présenter le principe 
de la démonstration du théorème dans le cas 
où f est positive et croissante. 
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Primitive d’une fonction e Déterminer des primitives des Une primitive F de la fonction continue et 
continue sur un intervalle. fonctions usuelles par lecture inverse du | positive f étant connue, on a : 


tableau des dérivées. b 
LG = F6) -F(a). 


e Connaître et utiliser les primitives de 
u'e",u'u" (n entier relatif, différent 


de —1) et, pour w strictement positive, 


Il est intéressant de démontrer ce 
théorème dans le cas d’un intervalle fermé 
borné, en admettant que la fonction a un 
minimum. 

On admet le cas général. 


Théorème : toute fonction 
continue sur un intervalle 
admet des primitives. 


On fait observer que certaines fonctions 
2 

comme x + exp(—x) n’ont pas de 

primitive « explicite ». 


Intégrale d’une fonction e Calculer une intégrale. La formule Î | f(x)dx = F(b)- F(a), 

continue de signe u 

quelconque. e Utiliser le calcul intégral pour 
déterminer une aire. 


établie pour une fonction continue et 
positive, est étendue au cas d’une fonction 
continue de signe quelconque. 


Linéarité, positivité, relation | e Encadrer une intégrale. 


L'intégration par parties n’est pas un 
de Chasles. . . P 


. ; attendu du programme. 
© Pour une fonction monotone positive, 


mettre en œuvre un algorithme pour La notion de valeur moyenne est illustrée 
déterminer un encadrement d’une par des exemples issus d’autres disciplines. 
intégrale. 


Valeur moyenne. 


S [SPC] Mouvement uniformément 
accéléré. 

$S [SI] Valeur moyenne, valeur efficace 
dans un transfert énergétique. 


Calcul du volume d'un solide. 
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2. Géométrie 

Nombres complexes 

En classe terminale, les nombres complexes sont vus essentiellement comme constituant un nouvel ensemble de 
nombres avec ses opérations propres. Cette introduction s’inscrit dans la perspective d’un approfondissement lors 
d’une poursuite d’études. 


Capacités attendues Commentaires 


Forme algébrique, conjugué. | + Effectuer des calculs algébriques On introduit dans ce chapitre des éléments 
Somme, produit, quotient. avec des nombres complexes. lui donnant une dimension historique. 


Equation du second degré à e Résoudre dans C une équation du 
coefficients réels. second degré à coefficients réels. 


Représentation géométrique. | e Représenter un nombre complexe par | Le plan est muni d’un repère orthonormé 
un point ou un vecteur. (O su, V ). 


Affixe d’un point, d’un e Déterminer l’affixe d’un point ou 
vecteur. d’un vecteur. 


Forme trigonométrique : e Passer de la forme algébrique à la La notation exponentielle est introduite 

- module et argument, forme trigonométrique et inversement. | après avoir montré que la fonction 
interprétation 0H cosÜ +isin@ 
géométrique dans un repère | e Connaître et utiliser la relation vérifie la même relation fonctionnelle que 
orthonormé direct ; __— | = | 2 la fonction exponentielle. 
notation exponentielle. 


e Effectuer des opérations sur les Les nombres complexes permettent de 

nombres complexes écrits sous mémoriser les formules trigonométriques 

différentes formes. d’addition et de duplication vues en 
première. 


$ [SI] Analyse fréquentielle d’un système. 
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Géométrie dans l’espace 


Dans cette partie, il s’agit, d’une part de renforcer la vision dans l’espace entretenue en classe de première, d’autre 
part de faire percevoir toute l’importance de la notion de direction de droite ou de plan. 

La décomposition d’un vecteur d’un plan suivant deux vecteurs non colinéaires de ce plan, puis celle d’un vecteur de 
l’espace suivant trois vecteurs non coplanaires, sensibilisent aux concepts de liberté et de dépendance en algèbre 
linéaire. 

Le repérage permet à la fois de placer des objets dans l’espace et de se donner un moyen de traiter des problèmes 
d’intersection d’un point de vue algébrique. Le concept d’orthogonalité, une fois exprimé en termes de coordonnées 
dans un repère orthonormé, fournit un outil pour une caractérisation simple des plans de l’espace. 


L'objectif est de rendre les élèves capables d’étudier des problèmes d’intersection de droites et de plans, en choisissant 
un cadre adapté, vectoriel ou non, repéré ou non. 


Droites et plans 


Positions relatives de droites | e Étudier les positions relatives de Le cube est une figure de référence pour la 
et de plans : intersection et droites et de plans. représentation des positions relatives de 
parallélisme. droites et de plans. 


Orthogonalité : e Établir l’orthogonalité d’une droite et | On étudie quelques exemples de sections 

- de deux droites ; d’un plan. planes du cube. Ce travail est facilité par 

- d’une droite et d’un plan. l’utilisation d’un logiciel de géométrie 
dynamique. 


Géométrie vectorielle 


Caractérisation d’un plan par On étend à l’espace la notion de vecteur et 

un point et deux vecteurs non les opérations associées. 

colinéaires. 
On fait observer que des plans dirigés par le 
même couple de vecteurs non colinéaires 
sont parallèles. 


Il est intéressant de présenter la 
démonstration du théorème dit « du toit ». 


Vecteurs coplanaires. e Choisir une décomposition pertinente | On fait percevoir les notions de liberté et de 
Décomposition d’un vecteur | dans le cadre de la résolution de dépendance. 

en fonction de trois vecteurs | problèmes d’alignement ou de 

non coplanaires. coplanarité. 


Repérage. e Utiliser les coordonnées pour : On ne se limite pas à des repères 
- traduire la colinéarité ; orthogonaux. 
- caractériser l’alignement ; 
Représentation paramétrique - déterminer une décomposition de La caractérisation d’un plan par un point et 
d’une droite. vecteurs. deux vecteurs non colinéaires conduit à une 
représentation paramétrique de ce plan. 


$ [SI] Cinématique et statique d’un 
système en mécanique. 
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Produit scalaire 


Produit scalaire de deux On étend aux vecteurs de l’espace la 
vecteurs dans l’espace : définition du produit scalaire donnée dans 
définition, propriétés. le plan. 


Vecteur normal à un plan. e Déterminer si un vecteur est normal à | On caractérise vectoriellement 
Équation cartésienne d’un un plan. l’orthogonalité de deux droites et on 
plan. introduit la notion de plans 

Caractériser les points d’un plan de perpendiculaires. 

l’espace par une relation 

ax + by + cz + d =0 avec a, b, c trois 


nombres réels non tous nuls. 


e Déterminer une équation cartésienne 
d’un plan connaissant un point et un 
vecteur normal. 


e Déterminer un vecteur normal à un 
plan défini par une équation cartésienne. 


Démontrer qu’une droite est 
orthogonale à toute droite d’un plan si 
et seulement si elle est orthogonale à 
deux droites sécantes de ce plan. 


e Choisir la forme la plus adaptée entre 
équation cartésienne et représentation 
paramétrique pour : 
- déterminer l’intersection d’une 
droite et d’un plan ; Perbendiculaire commune à deux droites non 
- étudier la position relative de deux | coplanaires. 
plans. Intersection de trois plans. 
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3. Probabilités et statistique 

On approfondit le travail en probabilités et statistique mené les années précédentes. 

Afin de traiter les champs de problèmes associés aux données continues, on introduit les lois de probabilité à densité. 
Le programme en propose quelques exemples et, en particulier, la loi normale qui permet notamment d’initier les 
élèves à la statistique inférentielle par la détermination d’un intervalle de confiance pour une proportion à un niveau 
de confiance de 95 %. 

Cette partie se prête particulièrement à l’étude de problèmes issus d’autres disciplines. 

Le recours aux représentations graphiques et aux simulations est indispensable. 


Conditionnement, 
indépendance 


Conditionnement par un e Construire un arbre pondéré en lien | On représente une situation à l’aide d’un 
événement de probabilité non | avec une situation donnée. arbre pondéré ou d’un tableau. On énonce 
nulle. et on justifie les règles de construction et 
Notation P,(B). e Exploiter la lecture d’un arbre d'utilisation des arbres pondérés. 
pondéré pour déterminer des 
probabilités. Un arbre pondéré correctement construit 
constitue une preuve. 
e Calculer la probabilité d’un Le vocabulaire lié à la formule des 
événement connaissant ses probabilités | probabilités totales n’est pas un attendu du 
conditionnelles relatives à une partition | programme, mais la mise en œuvre de cette 
de l’univers. formule doit être maîtrisée. 


Indépendance de deux Démontrer que si deux événements À | Cette partie du programme se prête 
événements. et B sont indépendants, alors il en est | particulièrement à l’étude de situations 


de même pour À et B. concrètes. 


© Des activités algorithmiques sont menées 
dans ce cadre, notamment pour simuler une 
marche aléatoire. 


S [SVT] Hérédité, génétique, risque 
génétique. 
Notion de loi à densité à Les exemples étudiés s’appuient sur une 
partir d’exemples expérience aléatoire et un univers associé 
Q, muni d’une probabilité. On définit alors 
Loi à densité sur un une variable aléatoire X , fonction de Q 
intervalle. dans R, qui associe à chaque issue un 
nombre réel d’un intervalle / de R. On 
admet que X satisfait aux conditions qui 
permettent de définir la probabilité de 
l'événement {X e J} comme aire du 
domaine : {M(x,y);xeJet0<y< f(x)} 
où f désigne la fonction de densité de la loi 
et J un intervalle inclus dans 7. 


Toute théorie générale des lois à densité et 
des intégrales sur un intervalle non borné 
est exclue. 
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Loi uniforme sur [ab]. e Connaître la fonction de densité de la | L’instruction « nombre aléatoire » d’un 

loi uniforme sur [a,b]. logiciel ou d’une calculatrice permet 
Espérance d’une variable d'introduire la loi uniforme sur [0,1]. 
aléatoire suivant une loi La notion d’espérance d’une variable 
uniforme. aléatoire à densité f sur [a,b] est introduite 


b 
à cette occasion par E(X) = [ tf(t)dt. On 


note que cette définition constitue un 
prolongement dans le cadre continu de 
l’espérance d’une variable aléatoire 


discrète. 
@ Méthode de Monte-Carlo. 
Lois exponentielles. e Calculer une probabilité dans le cadre On démontre qu’une variable aléatoire T 
d’une loi exponentielle. suivant une loi exponentielle vérifie la 


propriété de durée de vie sans 
vieillissement : pour tous réels f et 
positifs, P,..,(T 2t+h)=P(T2>h). 


Espérance d’une variable Démontrer que l’espérance d’une L’espérance est définie comme la limite 
aléatoire suivant une loi variable aléatoire suivant une loi 


cxnonentielle. quand x tend vers + de ( | tf(t) dt 


: , il 
exponentielle de paramètre À est —. | . .. . 
À où f est la fonction de densité de la loi 


exponentielle considérée. 


Cette partie du programme se prête 
particulièrement à l’étude de situations 
concrètes, par exemple sur la radioactivité 
ou la durée de fonctionnement d’un 
système non soumis à un phénomène 
d’usure. 
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Loi normale centrée réduite e Connaître la fonction de densité de la | Pour introduire la loi normale (0,1), on 
(0,1). loi normale W(0,1) et sa représentation | s’appuie sur l’observation des 
graphique. représentations graphiques de la loi de la 


hr x 


Vrp(l- p) 

suit la loi binomiale B (n, p), et cela pour de 

grandes valeurs de n et une valeur de p 

P(-u,<X<u,)=1-a@ lorsque X suit | fixée entre 0 et 1. Le théorème de Moivre 

la loi normale (0,1). Laplace assure que pour tous réels a et b, 
P(Z, ea,b]) tend vers 


Théorème de Moivre Laplace 


(acné). variable aléatoire Z, = 
Démontrer que pour & e ] 0,1 [, il 


existe un unique réel positif #,, tel que 


2 


x 
e ? dx lorsque n tend vers +00. 


e Connaître les valeurs approchées Î — 
u005 = 1,96 et 001 © 2,58. *V27 


L’espérance d’une variable aléatoire suivant 
la loi W(0,1) est définie par 


0 y 
lim Ï 1 f(o)dt + lim [ 1 f(b)dt où 


f désigne la densité de cette loi. 
On peut établir qu’elle vaut 0. 


On admet que la variance, définie par 
E((X -E(X)Y ), vaut 1. 


Loi normale W(4,0°) e Utiliser une calculatrice ou un tableur | Une variable aléatoire X suit une loi 
d'espérance y et pour calculer une probabilité dans le 1 


Da LH : ; 
d’écart-type ©. cadre d’une loi normale W( u,o° ). ALBEJ oO D 


N(0,1). 
On fait percevoir l’information apportée par 
la valeur de l’écart-type. 


S [SI et SPC] Mesures physiques sur un 
système réel en essai. 


e Connaître une valeur approchée de la | La connaissance d’une expression 
probabilité des événements suivants : algébrique de la fonction de densité de la loi 


{Xelu-o,u+ol}, N(u,0° ) n’est pas un attendu du 
{x e [u — 20,1 + 20|} et programme. 
{Xelu-30,u+30]}, 
lorsque X suit la loi normale 
N(4,0°). 


On illustre ces nouvelles notions par des 
exemples issus des autres disciplines. 
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Intervalle de fluctuation 


Estimation 
Intervalle de confiance (*). 


Niveau de confiance. 


Démontrer que si la variable aléatoire 
X, suit la loi B(n, p), alors, pour tout 


a dans Jo,1[ on a, 

X 
im (21, 1 
n—+00 n 


où /, désigne l’intervalle 


. p AP). APE) 
Vn Vn 


e Connaître l'intervalle de fluctuation 
asymptotique(*) au seuil de 95 % : 


pp +1,96 où 
n n 


p désigne la proportion dans la 
population. 


e Estimer par intervalle une proportion 
inconnue à partir d’un échantillon. 


e Déterminer une taille d’échantillon 
suffisante pour obtenir, avec une 
précision donnée, une estimation d’une 
proportion au niveau de confiance 0,95. 


La démonstration ci-contre donne 
l’expression d’un intervalle de fluctuation 
asymptotique(*) au seuil 1— & de la 


:  S : X nn 
variable aléatoire fréquence F,=" qui, à 
n 


tout échantillon de taille n, associe la 
fréquence obtenue f. 


Avec les exigences usuelles de précision, 
on pratique cette approximation dès que 
n2>30, np>5 et n(1-p)>5. 


En majorant 1,96./p(1- p), on retrouve 


l’intervalle de fluctuation présenté en classe 
de seconde. 


La problématique de prise de décision, déjà 
rencontrée, est travaillée à nouveau avec 
l’intervalle de fluctuation asymptotique. 


Les attendus de ce paragraphe sont 
modestes et sont à exploiter en lien avec les 
autres disciplines. 


Il est intéressant de démontrer que, pour 
une valeur de p fixée, l’intervalle 


1 F+ 1 
.. 
grand, la proportion p avec une probabilité 
au moins égale à 0,95. 


| contient, pour ñ assez 


On énonce alors que p est élément de 


1 1 

 — 
| 
niveau de confiance de plus de 95 %, où f 
désigne la fréquence observée sur un 
échantillon de taille n. 
Avec les exigences usuelles de précision, 
on utilise cet intervalle dès que n > 30, 
np >5 et n(l—-p)>S. 


avec un 


l’intervalle | 


La simulation de sondages sur tableur 
permet de sensibiliser aux fourchettes de 
sondage. 
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Il est important de noter que, dans d’autres 
champs, on utilise l’intervalle 


son sen 
nn 


qu’il n’est pas possible de justifier dans ce 
programme. 


$ [SVT] Analyse de graphiques où les 
données sont fournies par des intervalles de 
confiance. 


@ Prise de décision lors de la comparaison de deux 
proportions (bar exemple lors d'un essai 
thérapeutique). 


(*)Avec les notations précédentes : 


Un intervalle de fluctuation asymptotique de la variable aléatoire F, au seuil 1 — & est un intervalle déterminé à partir 
de p et de n et qui contient F, avec une probabilité d’autant plus proche de 1 — & que n est grand. 


Un intervalle de confiance pour une proportion p à un niveau de confiance 1 — & est la réalisation, à partir d’un 
échantillon, d’un intervalle aléatoire contenant la proportion p avec une probabilité supérieure ou égale à 1—«, 
intervalle aléatoire déterminé à partir de la variable aléatoire fréquence F, qui, à tout échantillon de tailler, associe la 


fréquence. 
Les intervalles de confiance considérés ici sont centrés en la fréquence observée f . 


Algorithmique 

En seconde, les élèves ont conçu et mis en œuvre quelques algorithmes. Cette formation se poursuit tout au long du 
cycle terminal. 

Dans le cadre de cette activité algorithmique, les élèves sont entraînés à : 

e décrire certains algorithmes en langage naturel ou dans un langage symbolique ; 

e en réaliser quelques-uns à l’aide d’un tableur ou d’un programme sur calculatrice ou avec un logiciel adapté ; 

e interpréter des algorithmes plus complexes. 

Aucun langage, aucun logiciel n’est imposé. 

L’algorithmique a une place naturelle dans tous les champs des mathématiques et les problèmes posés doivent être en 
relation avec les autres parties du programme (analyse, géométrie, statistiques et probabilités, logique) mais aussi avec 
les autres disciplines ou le traitement de problèmes concrets. 

À l’occasion de l’écriture d’algorithmes et de programmes, il convient de donner aux élèves de bonnes habitudes de 
rigueur et de les entraîner aux pratiques systématiques de vérification et de contrôle. 


Instructions élémentaires (affectation, calcul, entrée, sortie) 


Les élèves, dans le cadre d’une résolution de problèmes, doivent être capables : 

e  d’écrire une formule permettant un calcul ; 

e  d’écrire un programme calculant et donnant la valeur d’une fonction, ainsi que les instructions d’entrées et sorties 
nécessaires au traitement. 


Boucle et itérateur, instruction conditionnelle 


Les élèves, dans le cadre d’une résolution de problèmes, doivent être capables de : 
e programmer un calcul itératif, le nombre d’itérations étant donné ; 
e programmer une instruction conditionnelle, un calcul itératif, avec une fin de boucle conditionnelle. 
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Notations et raisonnement mathématiques 


Cette rubrique, consacrée à l’apprentissage des notations mathématiques et à la logique, ne doit pas faire l’objet de 
séances de cours spécifiques, mais doit être répartie sur toute l’année scolaire. 


En complément des objectifs rappelés ci-dessous, le travail sur la notion d’équivalence doit naturellement être 
poursuivi (propriété caractéristique, raisonnement par équivalence) et l’on introduit le raisonnement par 
récurrence. 


Notations mathématiques 


Les élèves doivent connaître les notions d’élément d’un ensemble, de sous-ensemble, d’appartenance et d’inclusion, 
de réunion, d’intersection et de complémentaire et savoir utiliser les symboles de base correspondants: €, €, LU," 
ainsi que la notation des ensembles de nombres et des intervalles. 


Pour le complémentaire d’un ensemble À, on utilise la notation des probabilités A. 


Pour ce qui concerne le raisonnement logique, les élèves sont entraînés sur des exemples à : 


e utiliser correctement les connecteurs logiques « et », « ou » et à distinguer leur sens des sens courants de « et », 
« ou » dans le langage usuel ; 

e utiliser à bon escient les quantificateurs universel, existentiel (les symboles V, 2 ne sont pas exigibles) et à repérer 
les quantifications implicites dans certaines propositions et, particulièrement, dans les propositions 
conditionnelles ; 

e distinguer, dans le cas d’une proposition conditionnelle, la proposition directe, sa réciproque, sa contraposée et sa 

négation ; 

utiliser à bon escient les expressions « condition nécessaire », « condition suffisante » ; 

formuler la négation d’une proposition ; 

utiliser un contre-exemple pour infirmer une proposition universelle ; 

reconnaître et utiliser des types de raisonnement spécifiques : raisonnement par disjonction des cas, recours à la 

contraposée, raisonnement par l’absurde. 
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Enseignement de spécialité 


L'enseignement de spécialité prend appui sur la résolution de problèmes. Cette approche permet une introduction 


motivée des notions mentionnées dans le programme. 


Plusieurs exemples de problèmes sont donnés à titre indicatif. L'étude des situations envisagées dans le cadre de cet 
enseignement conduit à un travail de modélisation et place les élèves en position de recherche. 


Les thèmes abordés sont particulièrement propices à l’utilisation des outils informatiques (logiciels de calcul, tableur) 


et à la mise en œuvre d’algorithmes. 


Le niveau d’approfondissement des notions est guidé par les besoins rencontrés dans la résolution des problèmes 


traités. 


Arithmétique 


Les problèmes étudiés peuvent notamment être issus de la cryptographie ou relever directement de questions 
mathématiques, par exemple à propos des nombres premiers. 


Exemples de problèmes 


Contenus 


Problèmes de codage (codes barres, code ISBN, clé du 
Rib, code Insee 


Problèmes de chiffrement (chiffrement affine, 
chiffrement de Vigenère, chiffrement de Hill). 


Questionnement sur les nombres premiers : infinitude, 
répartition, tests de primalité, nombres premiers 
particuliers (Fermat, Mersenne, Carmichaël). 


Sensibilisation au système cryptographique RSA. 


e Divisibilité dans Z. 

e Division euclidienne. 

e Congruences dans Z. 

e PGCD de deux entiers. 

e Entiers premiers entre eux. 
e Théorème de Bézout. 

e Théorème de Gauss. 

e Nombres premiers. 


e Existence et unicité de la décomposition en produit de 
facteurs premiers. 


Matrices et suites 


Il s’agit d'étudier des exemples de processus discrets, déterministes ou stochastiques, à l’aide de suites ou de matrices. 
On introduit le calcul matriciel sur des matrices d'ordre 2. Les calculs sur des matrices d'ordre 3 ou plus sont 
essentiellement effectués à l'aide d'une calculatrice ou d'un logiciel. 


Exemples de problèmes 


Contenus 


Marche aléatoire simple sur un graphe à deux ou trois 
sommets. 


Marche aléatoire sur un tétraèdre ou sur un graphe à N 
sommets avec saut direct possible d’un sommet à un 
autre : à chaque instant, le mobile peut suivre les arêtes 
du graphe probabiliste ou aller directement sur n’importe 
quel sommet avec une probabilité constante p. 


Etude du principe du calcul de la pertinence d’une page 
web. 


Modèle de diffusion d’Ehrenfest : N particules sont 
réparties dans deux récipients ; à chaque instant, une 
particule choisie au hasard change de récipient. 


Modèle proie prédateur discrétisé : 

- évolution couplée de deux suites récurrentes ; 

- étude du problème linéarisé au voisinage du point 
d'équilibre. 


e Matrices carrées, matrices colonnes : opérations. 
e Matrice inverse d’une matrice carrée. 


e Exemples de calcul de la puissance n-ième d’une 
matrice carrée d’ordre 2 ou 3. 


e Ecriture matricielle d’un système linéaire. 
e Suite de matrices colonnes (U,,) vérifiant une relation 


de récurrence du type U,,, = AU, +C : 


- recherche d’une suite constante vérifiant la relation de 
récurrence ; 
- étude de la convergence. 


e Étude asymptotique d’une marche aléatoire. 
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Annexe 
Programme de l’enseignement spécifique et de spécialité de mathématiques de la série économique et sociale et 
de l’enseignement de spécialité de mathématiques de la série littéraire 


L’enseignement des mathématiques au collège et au lycée a pour but de donner à chaque élève la culture 
mathématique indispensable pour sa vie de citoyen et les bases nécessaires à son projet de poursuite d’études. 

Le cycle terminal des séries ES et L permet l’acquisition d’un bagage mathématique qui favorise une adaptation aux 
différents cursus accessibles aux élèves, en développant leur sens critique vis-à-vis des informations chiffrées et, plus 
largement, en les formant à la pratique d’une démarche scientifique. 

L’apprentissage des mathématiques cultive des compétences qui facilitent une formation tout au long de la vie et 
aident à mieux appréhender une société en évolution. Au-delà du cadre scolaire, il s’inscrit dans une perspective de 
formation de l’individu. 


Objectif général 

Outre l’apport de nouvelles connaissances, le programme vise le développement des compétences suivantes : 
e mettre en œuvre une recherche de façon autonome ; 

e mener des raisonnements ; 

e avoir une attitude critique vis-à-vis des résultats obtenus ; 

e communiquer à l’écrit et à l’oral. 


Raisonnement et langage mathématiques 


Comme en classe de seconde, les capacités d’argumentation et de logique font partie intégrante des exigences du cycle 
terminal. 

Les concepts et méthodes relevant de la logique mathématique ne font pas l’objet de cours spécifiques mais prennent 
naturellement leur place dans tous les champs du programme. 


De même, le vocabulaire et les notations mathématiques ne sont pas fixés d’emblée, mais sont introduits au cours du 
traitement d’une question en fonction de leur utilité. 


Il convient de prévoir des temps de synthèse, l’objectif étant d’atteindre une bonne maîtrise en fin de cycle terminal. 


Utilisation d’outils logiciels 

L'utilisation de logiciels, d’outils de visualisation et de simulation, de calcul (formel ou scientifique) et de 
programmation change profondément la nature de l’enseignement en favorisant une démarche d’investigation. 

En particulier lors de la résolution de problèmes, l’utilisation de logiciels de calcul formel limite le temps consacré à 
des calculs très techniques afin de se concentrer sur la mise en place de raisonnements. 

L'utilisation de ces outils intervient selon trois modalités : 

e par le professeur, en classe, avec un dispositif de visualisation collective ; 

e par les élèves, sous forme de travaux pratiques de mathématiques ; 

e dans le cadre du travail personnel des élèves hors de la classe. 


Diversité de l’activité de l’élève 

Les activités proposées en classe et hors du temps scolaire prennent appui sur la résolution de problèmes 
essentiellement en lien avec d’autres disciplines. Elles enrichissent la culture scientifique dans différents domaines : 
historique, économique, artistique, etc. De nature diverse, elles doivent entraîner les élèves à : 

chercher, expérimenter, modéliser, en particulier à l’aide d’outils logiciels ; 

choisir et appliquer des techniques de calcul ; 

mettre en œuvre des algorithmes ; 

raisonner, démontrer, trouver des résultats partiels et les mettre en perspective ; 

expliquer oralement une démarche, communiquer un résultat par oral ou par écrit. 


Des éléments d’épistémologie et d’histoire des mathématiques s’insèrent naturellement dans la mise en œuvre du 
programme. Connaître le nom de quelques mathématiciens célèbres, la période à laquelle ils ont vécu et leur 
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contribution fait partie intégrante du bagage culturel de tout élève ayant une formation scientifique. La présentation de 
textes historiques aide à comprendre la genèse et l’évolution de certains concepts. 

Fréquents, de longueur raisonnable et de nature variée, les travaux hors du temps scolaire contribuent à la formation 
des élèves et sont essentiels à leur progression. Ils sont conçus de façon à prendre en compte la diversité et 
l’hétérogénéité de leurs aptitudes. 

Les modes d’évaluation prennent également des formes variées, en phase avec les objectifs poursuivis. En particulier, 
l’aptitude à mobiliser l’outil informatique dans le cadre de la résolution de problèmes est à évaluer. 


Organisation du programme 

Le programme fixe les objectifs à atteindre en termes de capacités. Il est conçu pour favoriser une acquisition 
progressive des notions et leur pérennisation. Son plan n’indique pas la progression à suivre. 

A titre indicatif, on pourrait consacrer environ deux tiers du temps à l’analyse et le reste aux probabilités et à la 
statisitque. 

Les capacités attendues indiquent un niveau minimal de maîtrise des contenus en fin de cycle terminal. La formation 
ne s’y limite pas. 

Les capacités attendues dans le domaine de l’algorithmique d’une part et du raisonnement d’autre part sont rappelées 
en fin de programme. Elles doivent être exercées à l’intérieur de chaque champ du programme. Les exigences doivent 
être modestes et conformes à l’esprit des filières concernées. 
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1. Analyse 


Un des objectifs de ce programme, comme en classe de première, est de doter les élèves d’outils mathématiques 
permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets. 

On poursuit l’étude des suites géométriques pour lesquelles on aborde la notion de limite, ce qui peut conduire à 
différents types de questionnement, notamment philosophique ou économique. 

On consolide l’ensemble des fonctions mobilisables, enrichi des fonctions exponentielles et de la fonction logarithme 
népérien. Les fonctions exponentielles sont l’occasion d’évoquer le passage d’une situation discrète à une situation 


continue. 


La notion de convexité est introduite et étudiée essentiellement dans un cadre graphique. Elle est largement utilisée en 
économie, en particulier pour des problèmes de coût ou de rendement croissant et décroissant. 
Enfin, s’ajoute le nouveau concept d’intégration qui, bien que modestement abordé et développé, demeure un concept 


fondamental de l’analyse. 


Suites 


Suites géométriques. 


Limite de la suite (g”), 
g étant un nombre réel 
strictement positif. 


Suites arithmético- 
géométriques. 


Notion de continuité sur un 
intervalle 


e Reconnaître et exploiter une suite 
géométrique dans une situation donnée. 
e Connaître la formule donnant 


1+g+...+q" avec gl. 


e Déterminer la limite d’une suite 
géométrique de raison strictement 
positive. 


e Étant donné une suite (g”) avec 
0 <qg<1, mettre en œuvre un 


algorithme permettant de déterminer un 


seuil à partir duquel g” est inférieur à 


un réel a positif donné. 


e Traduire une situation donnée à l’aide 
d’une suite arithmético-géométrique. 


e Exploiter le tableau de variation pour 
déterminer : 

- le nombre de solutions d’une équation 
dutype f(x) =£ ; 

- le signe d’une fonction. 


Le tableur, les logiciels de géométrie 
dynamique et de calcul sont des outils 
adaptés à l’étude des suites, en particulier 
pour une approche expérimentale de la 
notion de limite. 

On détermine, sans soulever de difficulté, la 
limite de la somme 1+qg+...+gqg" quand 
0O<qg<I. 

Le comportement lorsque n tend vers +00 
de la somme des n premiers termes de 
certaines suites géométriques fournit un 
exemple de suite croissante n’ayant pas 
pour limite +00. 

On évoque les aspects historiques et 
philosophiques de cette question en 
présentant quelques paradoxes classiques. 


Toute indication doit être donnée dans 
l’étude des suites arithmético-géométriques. 


On se limite à une approche intuitive et on 
admet que les fonctions usuelles sont 
continues par intervalle. 


La propriété des valeurs intermédiaires est 
présentée graphiquement ; on convient que 
les flèches obliques d’un tableau de 
variation traduisent la continuité et la stricte 
monotonie de la fonction sur l’intervalle 
considéré. 


On admet qu’une fonction dérivable sur un 
intervalle est continue sur cet intervalle. 
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Fonctions exponentielles 


Fonction xH g° avec qg >0. 


Relation fonctionnelle. 


Fonction exponentielle 
xhe. 


Dérivée de x + e“" où u est 


une fonction dérivable. 


Fonction logarithme 
népérien 


Relation fonctionnelle. 


Convexité 


Fonction convexe, fonction 
concave sur un intervalle. 


Convexité et sens de 
variation de la dérivée. 


e Connaître l’allure de la représentation 


graphique de la fonction x+ g”" selon 
les valeurs de q. 


e Connaître la dérivée, les variations et 
la représentation graphique de la 
fonction exponentielle. 


e Utiliser la relation fonctionnelle pour 
transformer une écriture. 


e Calculer la dérivée d’une fonction de 


la forme x+ e"°. 


e Connaître la dérivée, les variations et 
la représentation graphique de la 
fonction logarithme népérien. 


e Utiliser la relation fonctionnelle pour 
transformer une écriture. 


e Résoudre une équation de la forme 
x" =ksur]0;+00[ avec k € [0;+00[ et 
neN. 


e Reconnaître graphiquement des 
fonctions convexes, concaves. 


e Utiliser le lien entre convexité et sens 
de variation de la dérivée. 


Ces fonctions sont présentées comme un 
prolongement continu des suites 
géométriques. 

On admet que ces fonctions sont dérivables 
sur R et transforment les sommes en 
produits. 


On fait observer à l’aide d’un logiciel 
qu'entre toutes les fonctions exponentielles, 
une seule semble avoir 1 pour nombre 
dérivé en 0. 

L’existence et l’unicité de cette fonction 
sont admises. 

Le nombre e est l’image de 1 par cette 
fonction. 


On étudie des exemples de fonctions de la 
forme x+ e“°* notamment avec u(x)=—#x 
ou u(x}=-kx” (k > 0 ), qui sont utilisés 
dans des domaines variés. 


La notion générale de composée est hors 
programme. 


Pour tout réel x > 0 , le réel In x est 
l’unique solution de l’équation e”= x, 
d’inconnue y. 

On définit ainsi la fonction logarithme 
népérien. 


Une fonction dérivable sur un intervalle 7 
est dite convexe sur cet intervalle si sa 
courbe représentative est entièrement située 
au-dessus de chacune de ses tangentes. 

On met en évidence ces notions sur les 


fonctions de référence : xH x?, xH x ; 
xbe,xbinx. 


Le lien entre convexité et sens de variation 
de la dérivée est conjecturé puis admis. 
On peut utiliser le signe de la dérivée 
seconde. 
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Point d’inflexion. e Reconnaître graphiquement un point 


d’inflexion. 


Positions relatives des 
courbes représentatives des 


fonctions xHe*,xHIinx 
et x x. 


Intégration 


Définition de l’intégrale 
d’une fonction continue et 
positive sur [ab] comme aire 


sous la courbe. 
: b 
Notation Î f(x)dx. 


Théorème : si f est continue 
et positive sur [a,b], la 
fonction F définie sur [a,b] 


par F(x) OT est 


dérivable sur [a,b] et a pour 
dérivée f. 

Primitive d’une fonction 
continue sur un intervalle. 


Théorème : toute fonction 
continue sur un intervalle 
admet des primitives. 


e Déterminer des primitives des 
fonctions usuelles par lecture inverse du 
tableau des dérivées. 


e Connaître et utiliser une primitive de 


xt u'(xje"®. 


Intégrale d’une fonction de 
signe quelconque. 


e Calculer une intégrale. 


* Calculer l’aire du domaine délimité 
par les courbes représentatives de deux 
fonctions positives. 


Linéarité, positivité, relation 
de Chasles. 


Valeur moyenne d’une 
fonction continue sur un 
intervalle. 


Un point d’inflexion est un point où la 
représentation graphique traverse sa 
tangente. 

On met en évidence cette notion sur la 


fonction x+ x°. 


On s’appuie sur la notion intuitive d’aire 
rencontrée au collège et sur les propriétés 
d’additivité et d’invariance par translation 
et symétrie. 


Une primitive F de la fonction continue et 
positive f étant connue, on a : 


[ : fR&=FÉ)-F(0). 


On fait prendre conscience aux élèves que 


s 


certaines fonctions comme x + e * 
pas de primitive « explicite ». 


n’ont 


La formule | | fo&=F(É)-F(0), 


est étendue aux fonctions continues de 
signe quelconque. 


Les notions d’aire et de moyenne sont 
illustrées par des exemples issus des 
sciences économiques. 
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2. Probabilités et statistique 

On approfondit le travail en probabilités et statistique mené les années précédentes. 

Afin de traiter les champs de problèmes associés aux données continues, on introduit les lois de probabilité à densité. 
La loi normale permet d’initier les élèves à la statistique inférentielle par la détermination d’un intervalle de confiance 
pour une proportion à un niveau de confiance de 95 %. 

Cette partie se prête particulièrement à l’étude de problèmes issus d’autres disciplines, notamment des sciences 
économiques et sociales. 

Le recours aux représentations graphiques et aux simulations est indispensable. 


Conditionnement 


Conditionnement par un e Construire un arbre pondéré en lien | On représente une situation à l’aide d’un 
événement de probabilité non | avec une situation donnée. arbre pondéré ou d’un tableau. On énonce 
nulle. et on justifie les règles de construction et 
Notation P,(B). e Exploiter la lecture d’un arbre d'utilisation des arbres pondérés. 

pondéré pour déterminer des 


probabilités. Un arbre pondéré correctement construit 


constitue une preuve. 

Le vocabulaire lié à la formule des 
probabilités totales n’est pas un attendu du 
programme, mais la mise en œuvre de cette 
formule doit être maîtrisée. 


e Calculer la probabilité d’un 
événement connaissant ses probabilités 
conditionnelles relatives à une partition 
de l’univers. 


Cette partie du programme se prête 
particulièrement à l’étude de situations 
concrètes. 


Notion de loi à densité à Les exemples étudiés s’appuient sur une 
partir d’exemples expérience aléatoire et un univers associé 
Q, muni d’une probabilité. On définit alors 
Loi à densité sur un une variable aléatoire X, fonction de Q 
intervalle. dans R, qui associe à chaque issue un 
nombre réel d’un intervalle 7 de R. On 
admet que X satisfait aux conditions qui 
permettent de définir la probabilité de 
l'événement {X e J} comme aire du 


domaine : {M(x,y);xeJet0<y< f(x)} 


où / désigne la fonction de densité de la loi 
et Jun intervalle inclus dans J. 


Toute théorie générale des lois à densité et 
des intégrales sur un intervalle non borné 
est exclue. 


Loi uniforme sur [a, b]. e Connaître la fonction de densité de la | L’instruction « nombre aléatoire » d’un 

loi uniforme sur [a, b]. logiciel ou d’une calculatrice permet 
Espérance d’une variable d'introduire la loi uniforme sur [0,1]. 
aléatoire suivant une loi La notion d’espérance d’une variable 
uniforme. aléatoire à densité sur [ a,b] est introduite à 


b 
cette occasion par Î t f(t) dt. On note que 
a 


cette définition constitue un prolongement 
dans le cadre continu de l’espérance d’une 
variable aléatoire discrète. 
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Loi normale centrée réduite e Connaître la fonction de densité de la | Pour introduire la loi normale (0,1), on 
(0,1). loi normale (0,1) et sa représentation | s’appuie sur l’observation des 
graphique. représentations graphiques de la loi de la 


variable aléatoire 7, = Ré : 
Vrp(i- p) 

suit la loi binomiale B (n, p) et cela pour de 

grandes valeurs de n et une valeur de p 

fixée entre 0 et 1. 


e Connaître une valeur approchée de la 
probabilité de l’événement 

{ Xe [- 1,96; 1,96 ] } lorsque X suit la 
loi normale (0,1). 


À ce propos, on peut faire référence aux 
travaux de Moivre et de Laplace en les 
situant dans une perspective historique. 


Loi normale W(4,0°) e Utiliser une calculatrice ou un tableur | Une variable aléatoire X suit la loi (4,0 °) 


d'espérance u et d’écart-type | Pour obtenir une probabilité dans le FT. 
: cadre d’une loi normale (4,0 °). 


si suit la loi normale (0,1). 
Oo 


+ Connaître une valeur approchée de la | On se limite à une approche intuitive de la 

probabilité des événements suivants : notion d’espérance. 

(relu-0,#+ol}. 

{ Ye Lu _26,u+2 c] } Ë On exploite les outils logiciels pour faire 
percevoir l’information apportée par la 


{X elu-30,u +30] k valeur de l’écart-type. 


lorsque X suit la loi normale 
; . . ; 
N{(u,0°). La connaissance d’une expression 


algébrique de la fonction de densité de cette 
loi n’est pas un attendu du programme. 


On illustre ces notions par des exemples 
issus des sciences économiques ou des 
sciences humaines et sociales. 


Intervalle de fluctuation 
La variable aléatoire F, qui, à tout 
échantillon de taille n, associe la fréquence, 
prend ses valeurs dans l’intervalle de 
fluctuation asymptotique au seuil de 95 % 
avec une probabilité qui s’approche de 0,95 
quand n devient grand. 


e Connaître, pour n assez grand, On admet le résultat ci-contre, qui est 
l'intervalle de fluctuation asymptotique | conforté grâce à la simulation. 
(*) au seuil de 95 % : 


Avec les exigences usuelles de précision, 
Vrü= p) Vrü= p) - à 
1,96 , p +1,96 
\n \n 


on pratique cette approximation dès que 
n>30,np>5 et n(1l-p)>5. 

où p désigne la proportion dans la 

population. En majorant 1,964 p(1 — p) , on retrouve 
l’intervalle de fluctuation présenté en classe 
de seconde. 


La problématique de prise de décision, déjà 
rencontrée, est travaillée à nouveau. 
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Estimation e Estimer une proportion inconnue à Les attendus de ce paragraphe sont 
partir d’un échantillon. modestes et sont à exploiter en lien avec les 
Intervalle de confiance au autres disciplines. 
niveau de confiance 0,95(*). | e Déterminer une taille d’échantillon 
suffisante pour obtenir, avec une 
Niveau de confiance. précision donnée, une estimation d’une 1 
as : ff + 
proportion au niveau de confiance 0,95. n n 


confiance de plus de 95 %, où f désigne la 
fréquence observée sur un échantillon de 
taille n. 

Avec les exigences usuelles de précision, 
on utilise cet intervalle dès que n > 30, 
np >5 et n(l—-p)>5. 


On énonce que p est élément de l’intervalle 


| avec un niveau de 


La simulation de sondages sur tableur 
permet de sensibiliser aux fourchettes de 
sondage. 


Il est important de noter que, dans d’autres 
champs, on utilise l’intervalle 


Pt D ie) 
Un TT 


qu’il n’est pas possible de justifier dans ce 
programme. 


(*)Avec les notations précédentes : 
Un intervalle de fluctuation asymptotique de la variable aléatoire F', au seuil 0,95 est un intervalle déterminé à partir 
de pet de n et qui contient F, avec une probabilité d’autant plus proche de 0,95 que n est grand. 

1 
Vn Vn 


nn | Il : : ; 
Pour une valeur de p fixée, l’intervalle aléatoire | F, - FE, + _ contient, pour # assez grand, la proportion p à 
estimer avec une probabilité au moins égale à 0,95. 
Un intervalle de confiance pour une proportion p au niveau de confiance 0,95 est la réalisation, à partir d’un 
échantillon, d’un intervalle aléatoire contenant la proportion p avec une probabilité supérieure ou égale à 0,95, 
intervalle aléatoire déterminé à partir de la variable aléatoire F, qui, à tout échantillon de taille n, associe la 
fréquence. 
Les intervalles de confiance considérés ici sont centrés en la fréquence observée f. 
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Algorithmique 
En seconde, les élèves ont conçu et mis en œuvre quelques algorithmes. Cette formation se poursuit tout au long du 
cycle terminal. 
Dans le cadre de cette activité algorithmique, les élèves sont entraînés à : 
e décrire certains algorithmes en langage naturel ou dans un langage symbolique ; 
e en réaliser quelques-uns à l’aide d’un tableur ou d’un programme sur calculatrice ou avec un logiciel adapté ; 
e interpréter des algorithmes plus complexes. 
Aucun langage, aucun logiciel n’est imposé. 
L’algorithmique a une place naturelle dans tous les champs des mathématiques et les problèmes posés doivent être en 
relation avec les autres parties du programme (algèbre et analyse, statistiques et probabilités, logique), mais aussi avec 
les autres disciplines ou le traitement de problèmes concrets. 
À l’occasion de l'écriture d’algorithmes et de programmes, il convient de donner aux élèves de bonnes habitudes de 
rigueur et de les entraîner aux pratiques systématiques de vérification et de contrôle. 


Instructions élémentaires (affectation, calcul, entrée, sortie) 


Les élèves, dans le cadre d’une résolution de problèmes, doivent être capables : 

e  d’écrire une formule permettant un calcul ; 

e  d’écrire un programme calculant et donnant la valeur d’une fonction, ainsi que les instructions d’entrées et sorties 
nécessaires au traitement. 


Boucle et itérateur, instruction conditionnelle 


Les élèves, dans le cadre d’une résolution de problèmes, doivent être capables de : 
e programmer un calcul itératif, le nombre d’itérations étant donné ; 
°e programmer une instruction conditionnelle, un calcul itératif, avec une fin de boucle conditionnelle. 


Notations et raisonnement mathématiques 
Cette rubrique, consacrée à l’apprentissage des notations mathématiques et à la logique, ne doit pas faire l’objet de 
séances de cours spécifiques mais doit être répartie sur toute l’année scolaire. 


Notations mathématiques 


Les élèves doivent connaître les notions d’élément d’un ensemble, de sous-ensemble, d'appartenance et d’inclusion, 
de réunion, d’intersection et de complémentaire et savoir utiliser les symboles de base correspondants : €, €, U,n 
ainsi que la notation des ensembles de nombres et des intervalles. 


Pour le complémentaire d’un ensemble À, on utilise la notation des probabilités A. 


Pour ce qui concerne le raisonnement logique, les élèves sont entraînés sur des exemples à : 


e utiliser correctement les connecteurs logiques « et », « ou » et à distinguer leur sens des sens courants de « et », 
«ou » dans le langage usuel ; 

e utiliser à bon escient les quantificateurs universel, existentiel (les symboles V, 2 ne sont pas exigibles) et repérer 
les quantifications implicites dans certaines propositions et, particulièrement, dans les propositions 
conditionnelles ; 

e distinguer, dans le cas d’une proposition conditionnelle, la proposition directe, sa réciproque, sa contraposée et sa 

négation ; 

utiliser à bon escient les expressions « condition nécessaire », « condition suffisante » ; 

formuler la négation d’une proposition ; 

utiliser un contre-exemple pour infirmer une proposition universelle ; 

reconnaître et utiliser des types de raisonnement spécifiques : raisonnement par disjonction des cas, recours à la 

contraposée, raisonnement par l’absurde. 
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Enseignement de spécialité, série ES 


L’enseignement de spécialité prend appui sur la résolution de problèmes. Cette approche permet une introduction 
motivée des notions mentionnées dans le programme. Plusieurs exemples de problèmes sont donnés à titre mdicatif. 


L'étude de telles situations conduit à un travail de modélisation et place les élèves en position de recherche. 


Les thèmes abordés sont particulièrement propices à l’utilisation des outils informatiques (logiciels de calcul, tableur) 


et à la mise en œuvre d’algorithmes. 


Les graphes probabilistes permettent d’étudier des phénomènes d'évolution simples et de faire un lien avec les suites. 
Les matrices sont présentées comme des tableaux de nombres. Au même titre que les graphes, elles apparaissent 


comme des outils pour résoudre des problèmes. 


Le niveau d’approfondissement des notions est guidé par les besoins rencontrés dans la résolution des problèmes 
traités. Les thèmes abordés ne doivent pas faire l’objet d’un développement théorique. 


Exemples de problèmes 


Contenus 


Recherche de courbes polynomiales passant par un 
ensemble donné de points. 


Gestion de flux, problèmes simples de partitionnement de 
graphes sous contraintes : problème du voyageur de 
commerce, gestion de trafic routier ou aérien, planning de 
tournois sportifs, etc. 


Modélisation d’échanges inter-industriels (matrices de 
Léontief). 


Codage par un graphe étiqueté, applications à l'accès à un 
réseau informatique, reconnaissance de codes. 


Minimisation d’une grandeur (coût, longueur, durée, etc.). 


Phénomènes évolutifs (variation d’une population, 
propagation d'une rumeur ou d'un virus, etc.). 


e Matrice carrée, matrice colonne : opérations. 
e Matrice inverse d'une matrice carrée. 


e Graphes : sommets, sommets adjacents, arêtes, degré 
d’un sommet, ordre d’un graphe, chaîne, longueur d’une 
chaîne, graphe complet, graphe connexe, chaîne 
eulérienne, matrice d’adjacence associée à un graphe. 


e Recherche du plus court chemin sur un graphe pondéré 
connexe. 


e Graphe probabiliste à deux ou trois sommets : matrice 
de transition, état stable d'un graphe probabiliste. 
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Introduction 


Le document ressource pour la partie du programme de la classe terminale « Probabilités et 
statistique » donne des éléments détaillés permettant aux professeurs de construire leur propre cours. Il 
ne s’agit pas d’un modèle reproductible tel quel mais d’un support théorique sur les notions introduites 
pour la première fois dans les programmes du secondaire. 


Ces notions sont enseignées dans différents cursus de l’enseignement supérieur mais le point de vue 
adopté dans le programme de la classe terminale est assez différent. 


Les fondements de théorie des probabilités indispensables pour comprendre les notions de statistique 
inférentielle présentes dans le programme sont développés aussi précisément que possible à ce niveau 
d’enseignement. 


La loi normale est introduite en terminale S comme loi-limite d’une suite de variables aléatoires grâce 
au théorème de Moivre-Laplace. Bien qu’admis, ce théorème se visualise facilement grâce à des 
animations avec un logiciel de géométrie dynamique ou sur tableur et c’est sous cette forme que la loi 
normale doit être introduite en terminale ES. 


La notion d’intervalle de fluctuation d’une variable aléatoire a été introduite en seconde et développée 
en première dans le cadre de la loi binomiale à l’aide de calculs sur tableur. Elle est enrichie par la 
notion d'intervalle de fluctuation asymptotique d’une variable aléatoire fréquence qui présente 
l’intérêt de pouvoir se déterminer par un simple calcul. 


La notion d’intervalle de confiance pour une proportion est introduite grâce à l’intervalle de 
fluctuation asymptotique. 


Tous les nouveaux items sont présentés avec des activités. Celles-ci sont souvent mises en œuvre sur 
calculatrices ou avec un algorithme. Des exemples d’exercices sont également proposés. 


Un complément sur les lois uniforme et exponentielles est proposé, leur approche ayant été modifiée. 


L’annexe 1 présente un historique du théorème de Moivre-Laplace en montrant que le concept de 
fluctuation d’une variable aléatoire autour de son espérance est apparu très tôt avec Jacques Bernoulli 
et a gagné en précision avec Moivre puis Laplace. 


L’annexe 2 donne des compléments sur les lois normales, en particulier sur la fonction de répartition. 
Cette dernière n’est pas un attendu du programme mais est utilisée par les calculatrices pour les calculs 
de probabilités sur les lois normales. 


L’annexe 3 propose une introduction à la théorie des sondages et donne quelques méthodes 
couramment utilisées. 


L’annexe 4 donne le descriptif des fichiers tableurs, des animations et des algorithmes écrits dans 
différents langages (Algobox, Scilab, R,.) figurant dans le document. Tous ces fichiers sont 
téléchargeables. Une aide à la prise en main du logiciel R est également fournie. 


L’annexe 5 donne une approche du calcul numérique d’une intégrale par la méthode de Monte-Carlo. 


L’annexe 6 fournit des éléments de justification à propos de la notion de différence significative et du 
critère de disjonction des intervalles de confiance présenté dans le programme de la filière STI2D- 
STL. Ces éléments n’ont pas à être abordés avec les élèves. 


Un document annexe propose une démonstration du théorème de Moivre-Laplace, élaborée de telle 
sorte que seuls des outils de terminale’ y sont utilisés. Bien entendu cette démonstration n’est pas au 
programme mais le théorème de Moivre-Laplace en étant le socle théorique fondamental pour la partie 
probabilités, il a semblé intéressant d’en faire une proposition de démonstration. 


Le théorème de Moivre-Laplace étant un cas particulier d’un théorème général connu sous le nom de 
théorème-limite central, une approche de ce théorème est proposée à partir de la loi des erreurs. 


À l’exception d’un changement de variable (linéaire) incontournable... 
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I. Variable centrée réduite 


A. Comment centrer et réduire 


Une variable aléatoire est dite centrée et réduite si son espérance est nulle et si son écart type vaut 1. 


Soit X une variable aléatoire discrète d’espérance E(X) = m, de variance V(X) et d’écart type 
o={/V(X) non nul. 


e La variable aléatoire (X —-m) a une espérance nulle 


e La variable aléatoire Z = a une espérance nulle et une variance 


( 
égale à 1, donc un écart type égal à 1. 


Attention 


L’écart-type d’une variable aléatoire suivant une loi binomiale ne fait pas partie des contenus 
mentionnés dans le programme des classes de première ES et L. Il convient donc, avant d’aborder le 
chapitre sur la loi normale en terminale, de l’introduire en lien avec l’écart-type d’une série statistique 
et d’en faire percevoir les effets dans le cadre d’une activité de simulation. 


Si une variable X prend ses valeurs entre 0 et n, (X —-m) les prend entre —m et n—-m donc 


X -m m n— 
les prend entre —-— et 
œ œ œ 


diagramme en bâtons, on obtient la représentation de la variable (X —m) par translation de vecteur 


mn = . Lee  : 
Z = . Si la variable aléatoire X est représentée par un 


— m i de ce diagramme. Puis on obtient la représentation de la variable aléatoire Z par « réduction » 
du nouveau diagramme. Les abscisses sur lesquelles sont construits les bâtons sont les valeurs de 
X — 

© 
à une concentration si © >1. Sur le graphique ci-dessous, on a à droite le diagramme en bâton d’une 
variable #, à gauche en clair le diagramme de (X — m) et en plus foncé celui de Z. 


Figure 1 : Effet graphique du centrage et de la réduction 
sur une variable X suivant une loi @ (45 ; 0,65) 


m " x . , 
et les hauteurs des bâtons sont les mêmes que celles obtenues pour la variable X, cela conduit 


(1 e di 


Document associé : centrer et réduire une binomiale.ggb 


B. Pourquoi centrer et réduire ? 


Lorsqu'on passe de X à Z, on obtient une variable aléatoire dont les paramètres (espérance et variance) 
ne dépendent plus de ceux de X. 


Rappel 

Une variable aléatoire qui suit la loi binomiale  (n, p) peut s’interpréter comme un nombre de succès 
lors de la répétition de n expériences de Bernoulli indépendantes. 

Soit X, une variable aléatoire suivant la loi binomiale  (n, p) ; on a : 
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E(X,) = np, V(X,) = np — p), et o (A3) = Jnp(i — p). 
X, np 


JrpA — p) 


n 


La variable aléatoire Z, = a pour espérance 0 et pour variance 1, indépendantes de n et de p. 


La variable aléatoire F, = correspond à la proportion de succès, son espérance est p et sa variance 


est PEER), 

n 
On constate que F, a une espérance qui ne dépend pas de n et une variance qui diminue quand n 
augmente c'est-à-dire que les réalisations de F, « ont tendance à se resserrer » autour de p lorsque n 
augmente. C’est cette concentration des valeurs les plus probables de F, qui permettra d’améliorer la 
prise de décision à partir des observations. 


n=2 P=04 n=e0 p=04 


Figure 2 : Diagrammes en bâtons de F, pour n = 25 et n = 60 
Document associé : diagramme en bâtons de Fn.ggb 


: . : À : X, 
Sur les graphiques ci-dessus, on a représenté le diagramme en bâtons d’une variable F, =—= où X, 
n 


suit la loi binomiale de paramètres 25 et 0,4 puis 60 et 0,4. Les valeurs prises par F, sont entre 0 et 1 
quel que soit n. 

Le paragraphe suivant va permettre de constater que la variable Z, «tend» vers une variable 
universelle indépendante de p. La connaissance de la loi de cette variable universelle permet de 


n 


n 


préciser la fluctuation de autour de son espérance p. 


IT. La loi normale centrée réduite 


A. Activité : Introduction au théorème de Moivre-Laplace 
Dans la représentation de la figure 3, on considère une variable aléatoire X, suivant une loi binomiale 
8 (n, p) et Z, est la variable centrée réduite associée. 
On prend deux valeurs a =—1 et b=2 et on s’intéresse à P(-1<7, <2). 
Pour le cas visualisé ci-dessous, on a pris nr =100 et p =0,5. 


Donc P(-1< Z,99 <2)= P(45< X 59 < 60). 


: — 50 
Les valeurs prises par Z;,, quand —-1<Z,,, <2 sont de la forme avec 45 <k< 60. 


L’idée est d’associer la loi (discrète) de Z,,, à des aires de rectangles, comme on le fait pour 
l’histogramme d’une variable continue. 
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À chaque valeur de k on fait correspondre un rectangle vertical dont laire est égale à 


P(X 00 = Æ) = P(Z;50 —— et dont la base est un segment de l’axe horizontal de longueur = 


centré sur re étant l’écart entre deux valeurs consécutives prises par Z). La hauteur de ce 


rectangle est donc 5P(X =#). 


La réunion des rectangles obtenue pour 45 < £ < 60 a donc pour aire P(-1<Z,% <2). 


p=05 


s=sqtinp(1-p}} (écart type) 


aire sous la courbe = 0,819 


aire des rectangles = 0,647 


Figure 3 : Visualisation de P(a<Z, <b) 


Document associé : binomiale et normale.ggb 


Les bords supérieurs des rectangles font apparaître une courbe régulière et symétrique délimitant une 
aire qui est voisine de celle de la réunion des rectangles. 


Le mathématicien Abraham de Moivre, protestant français émigré en Angleterre après la révocation de 
l’édit de Nantes (1685), a découvert que cette courbe est la courbe représentative de la fonction 


x Ni 2. Le cours de terminale sur l’intégration permet d’écrire que l’aire située sous cette 


x2 


2. 1 => ; ee 
courbe vaut ( : Br e 2dx. Pour comparer l’aire de la réunion des rectangles et celle sous la courbe, 
427 


on peut remplir le tableau suivant : 


k 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 


P(X =£k) | 0,048 | 0,058 | 0,067 | 0,073 | 0,078 | 0,080 | 0,078 | 0,073 | 0,067 | 0,058 | 0,048 | 0,039 | 0,030 | 0,022 | 0,016 | 0,010 
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x? 


9. _— 
La somme des aires des rectangles vaut 0,85 à 10° près et la valeur de ( e 2dx, qu’on peut 


1 
-1 2x 


obtenir avec une calculatrice, est 0,82 à 10 ? près. 


À partir de l’animation proposée, on constate que : 


e Lorsque ñ devient grand, à p fixé, la largeur des rectangles est de plus en plus petite car elle 


1 1 
VAUT — = ———. 
T Jrp(l- p) 


e _L’aire correspondant à P(Z, e[a,b]) se rapproche de l’aire entre a et b sous une courbe fixe, 


qui est la courbe représentative de la fonction x + Er e 


1 
V2T 
Exercice (TS) 


_ 
Soit la fonction g définie par g(x) = e 2. 
1. Montrer que la fonction dérivée g'est minimale pour x =1. 
Montrer que la fonction x x + g(x) est croissante sur [0, +00! . 
3. En déduire que si 0 < a £b alors a —b < g(b)-g(a)<0 et que si a £b <0 alors 
O<g(b)-g(a) <b—a. 


4. En déduire que pour tous réels a et b on a : |\g(b) — g(a) = 1 - al . 


B. Théorème de Moivre-Laplace 
Le résultat suivant est au programme de la classe de terminale S uniquement et il est admis. 
Théorème 
On suppose que, pour tout entier #, la variable aléatoire X, suit une loi binomiale @ (n, p). 


X,-np 


n 


Ynp(i- p) 


b 
Alors, pour tous réels a et b tels que a<b, on a: lim P(a<Z, <b)=| 
n—+0 a 


On pose Z,, — , variable centrée et réduite associée à X, . 


2 


1 ns 
e 2dx. 


V2 


Voici ce que dit Laplace à propos des travaux de Moivre : 


«Moivre a repris dans son ouvrage [The doctrine of Chances] le théorème de Jacques Bernoulli 
sur la probabilité des résultats déterminés par un grand nombre d’observations?. 


Il ne se contente pas de faire voir, comme Bernoulli, que le rapport des événements qui doivent 
arriver approche sans cesse de celui de leurs possibilités respectives, il donne de plus une 
expression élégante et simple de la probabilité que la différence de ces deux rapports soit contenue 
dans des limites données. » 


? Ce résultat est la loi des grands nombres. En seconde, on a donné une forme simplifiée de la loi des grands 
nombres, à savoir : la probabilité que la variable fréquence s’écarte de p diminue quand le nombre 
d’observations augmente. 


Ministère de l’éducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 7 sur 70 
Mathématiques - Probabilités et statistique 


http://eduscol.education.fr/proq 


L’annexe 1 donne des développements sur ce théorème fondamental. 


C. La loi normale centrée réduite 
Définition 
Une variable aléatoire X suit la loi normale centrée réduite” notée W (0,1) si, pour tous réels a et b 
tels que a < b, on a : 


P(a< X <b)= [ra - Le 2. 


V27 


x? 


e 2 est appelée la fonction de densité de la loi W(0,1). 


La fonction f définie sur IR par 


1 
V2T 
1. Premières propriétés 
e _fest continue sur R. 


e  L’aire totale sous la courbe de f est égale à 1, elle représente la probabilité P(X € - c,+o0[). 


e La fonction f est paire ; sa courbe représentative est donc symétrique par rapport à l’axe des 
ordonnées. 


Il 
e _L’aire sous la courbe sur [0,+c] est égale à rs 


e  Pourtoutréelu, P(X <—-u)=1-P(X <u). 


Sur la figure, où u > 0 , les aires grisées sont égales en raison de la symétrie de la courbe 
représentative. 


Figure 4: Représentation graphique de la fonction de densité de la loi normale centrée réduite 


Théorème (au programme de terminale S) 
Si X est une variable aléatoire suivant la loi normale (0,1) alors, pour tout réel & € b.1[, il 
existe un unique réel positif #, tel que P(-u, SX <u,)=1-a. 


Démonstration (faisant partie des exigibles en terminale S). 


Cette démonstration est intéressante car elle permet de réinvestir le cours sur les fonctions et 
l'intégration. 


? Cette loi est également nommée "loi normale standard", en particulier dans les tableurs courants, mais cette 
dénomination ne figure pas au programme. 
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D’après la symétrie de la courbe, on a pour tout réel positif, 
P(-u < X <u)=2P(0< X <u)=2 [ fG)dx = 2H{(u), 
où H est la primitive de f sur IR qui s’annule en 0. La fonction H est donc continue et strictement 


; : LL. +. 
croissante sur 10, +00] . On a lim H{(u) . puisque cela correspond à l’aire sous la courbe pour 


Uu—+0 


u € [O, +00], c'est-à-dire à P(X >0). 


La fonction 2H admet donc le tableau de variations et la courbe représentative ci-dessous : 


t 0 +00 


2H) 


Figure 5 : courbe de la fonction 2H 


Pour tout réel & compris strictement entre 0 et 1, le réel (1 — a) est également compris strictement 
entre 0 et 1 et donc, d’après le corollaire du théorème des valeurs intermédiaires, il existe un unique 


réel u, strictement positif tel que 2H(u,)=1-a c'est-à-dire tel que P(-u + SXEU : =1-«. 


P(X<-u, ) = 2 


-U u 


Il y a deux valeurs approchées très utilisées qu’il faut connaître : 


uos & 1,96 et un 2,58 (à 10° près) 


uoos est le réel pour lequel P(-4595 < À <u995) = 0,95 et on a donc : P(-1,96< X <1,96) & 0,95 
de même, P(—-2,58 < X <2,58)= 0,99. 
Cela donne une idée de la répartition des valeurs de X. Environ 95% des réalisations de X se trouvent 


entre — 1,96 et 1,96. 
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2. Espérance d’une loi normale centrée réduite (uniquement en terminale S) 
Selon la définition donnée dans le programme : 


Si * suit la loi W(0,1), alors l’espérance de X est définie par : 


EN = lim [rf(Odr + lim ['ercoar. 


(on fera le lien avec ce qui est vu avec les lois uniformes et exponentielles). 


L’espérance d’une variable aléatoire X suivant la loi W(0,1) est nulle. En effet : 


» y 1 À 1 1 _ 
tft )jdt= | ——te ?dt= ——| 1-e ? 
[É f#) Ï. V2T 27 | | 


12 
oi 
( te ?df = 
0 


0 Il = 
De même, | # ft )dt = | e ? -1 
* V2T 


Par passage à la limite, on obtient E(X) = 0. 


La variance de X est définie par l’espérance du carré de l’écart entre X et son espérance soit 
E((X - E(X))°) et on admet qu’elle vaut 1. 


On peut proposer le calcul de la variance en exercice, selon une méthode analogue à celle utilisée pour 
le calcul de l’espérance d’une loi exponentielle. 


III. Lois normales 


A. Généralités 


On dispose d’un échantillon de 50 000 tailles (en cm) d’hommes adultes dont voici un résumé 
statistique et un histogramme”: 


Moyenne 


Écart type 


Nombre 


Minimum 


Maximum 


Médiane 


Interquartile 


Tailles 


175,0 


8,0 


50 000 


145,1 


208,5 


175,0 


10,8 


Histogram me 


an 
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LES Le ee 


_ 


T (] 
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35 200 205 210 


1 
û 
e 
L 
di 
60 165 170 


150 155 L 


“ 
æ- 
on 


175 180 L 
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Figure 6 : Répartition des 50000 valeurs de la taille 


Si on centre et réduit la variable «taille », l’histogramme obtenu présente une analogie évidente avec 
la figure 3° ; cela motive la définition suivante. 


* Cet exemple est emprunté au document d’accompagnement publié en 2002. 
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suit la loi normale 


Une variable aléatoire X suit une loi W(u, o ?) si la variable aléatoire 


w(0,1). 
L’espérance de X vaut u et sa variance vaut o. La notation (4, o *) est justifiée à l’annexe 2. 


Remarque 
Il s’agit d’une loi à densité c'est-à-dire qu’il existe une fonction g définie sur IR telle que, pour tous 


b 
réels a et b vérifiant a < b, on a P(a< X <b)= Ï g(#t)dt. L'expression de la fonction de densité de X 


n’est pas au programme. 


On peut constater que z est à la fois l’espérance et la médiane’ de X. 


Exemple 


La masse en kg des nouveaux nés à la naissance est une variable aléatoire qui peut être modélisée par 
une loi normale” de moyenne # = 3,3 et d’écart type o = 0,5. La probabilité qu’un nouveau né pèse 
X -3,3 


moins de 2,5 kg à la naissance est donc : P(X< 2,5). La variable Z = suit la loi W(0,1). 


0] 


On a alors : P(X< 2,5) = P(Z < 25-33 


)=P(Z<-1,6)=1-P(Z<1,6)<0,055. 


, 


La probabilité cherchée est donc égale à 0,055 à 10 * près. 
On peut aussi obtenir directement la valeur de P(X < 2,5). 
On donne dans le paragraphe B la méthode pour obtenir cette valeur à la calculatrice. 


Les intervalles « Un, deux, trois sigmas » 


Les résultats suivants sont utilisés dans de nombreux contextes ; ils peuvent être visualisés sur la 
figure 7 ci-dessous : 


P(u-o<X<u+o)*0,68 (à 107 près) 
P(u-20 <X <u+20 )#0,95 (à 10° près) 
P(u-30 <X <u+30o)+0,997 (à 10 * près). 


* 11 faut noter qu’il s’agit ici d’un histogramme car la variable « taille » est continue alors que sur la figure 3 les 
rectangles ne sont pas ceux d’un histogramme car la variable binomiale n’est pas continue. 


$ Un réel m est une médiane d’une variable aléatoire si P (X < m) =0,5 

7 Le poids d’un nouveau né ne prend pas de valeurs négatives mais on peut vérifier que P(X < 0) est négligeable 
de même que P(X > 5). 
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Représentations graphiques montrant l’importance de la valeur de l’écart type 6 


Courbes représentatives des densités de la loi normale (0, 1/4) en rouge (maximum voisin de 0,8), de 
la loi normale W(0,1) en bleu et de la loi normale (0,4) en vert. 


Figure 8: Influence de l'écart type 


B. Exemples d’exercices 


1. Montrer que si X suit la loi W(0,1), alors — X suit la même loi. 


2. La sélection chez les vaches laitières de race « Française Frisonne Pis Noir » 


La production laitière annuelle en litres des vaches laitières de la race FFPN peut être modélisée par 
une variable aléatoire à densité X, de loi normale de moyenne u — 6000 et d’écart-type o — 400. La 
fonction g désigne la fonction de densité de cette loi normale. 


1° Afin de gérer au plus près son quota laitier (production maximale autorisée), en déterminant la taille 
optimale de son troupeau, un éleveur faisant naître des vaches de cette race souhaite disposer de 
certaines probabilités. 


a) Calculer la probabilité qu'une vache quelconque de cette race produise moins de 5800 litres par an. 
Solution 
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En utilisant calculatrices ou logiciels, on trouve : P(X < 5800) = 0,3085. Certaines calculatrices et 
logiciels de calcul numérique proposent une fonction dédiée à ce type de calcul (pnorm() dans R, 
normalFRép chez Texas (normaFrép pour fonction de répartition de la loi normale), menu Ncd chez 
Casio (Ncd pour Normal cumulative density). Il y a un faux ami: P(X< x) qui est la fonction de 
répartition, en français est appelé "distribution function" en anglais, alors que notre fonction de 
distribution pour une variable discrète est classiquement P(X = x). 


Attention ! 
Les calculatrices ne fournissent pas P(X < x) mais seulement P(a £<X< b). 


Pour le calcul de P(X à) dans le cas où X suit une loi W{u, © *), la règle pratiquée est donc la 
suivante : 
e Six>u,onutilise P(X<x)=0,5+P(u<X<x) 


e Six<u,onutilise P(X<x)=0,5-P(x<X<u). 


Pour entrer les paramètres, il faut saisir les valeurs de z et de & (et non o?). 


R TEXAS (83Plus) et + CASIO(35+) et + 
répartition normale répartition normale pré programmée | répartition normale pré 
pré programmée UE - programmée 
pnorm(5800, mean = normalFRép (5800,6000,6000,400) menu stat  dist b NORM 
6000, 0..3085375 Ncd Lower : 5800 ; Upper 
sd = 400, lower.tail : 6000 
= TRUE) ou & 2: 400: ; y à 6000. 
=, t À 1 . 
ou pnorm(5800, 6000, |Cemplément pour l'enseignant : Normal C.D. prob = 0.19147 
intégration numérique après changement de 
400) variable pour se ramener à la loi normale «TS = 19187 
l'A «08085875 centrée réduite. 30809 
intégrFonct (1/V(211)*e(- E’/2): t:-5, (5800 - 
ou 6000)/400) ou 
Complément pour 0.3085373 Complément pour l'enseignant : 
l'enseignant : intégration numérique après 
intégration numérique de la changement de variable pour se 
densité d’une loi normale ramener à la loi normale centrée 
de paramètres mu sigma. réduite 
(-Inf signifie moins SET UP Integration : Simpson 
l'infini et Inf plus menu RUN  OPTN  CALC  fdx( 
l'infini. $value signifie 1/V(2H)*e"(- x2/2), -5, (5800 - 
que l'on ne prend que la 6000)/400) 
valeur numérique de l'objet 0: 3085572 


résultat de la fonction 
integrate. La fonction 
gauss est la densité d'une 
loi de Gauss d'espérance mu 
et d'écart type sygma, g en 
est un cas particulier) 
gauss <- function(x, mu = 
moy, sigma = et){dnorm(x, 
mu, sigma) } 
moy <- 6000 ; et <- 400 
integrate(gauss, -Inf, 
5800) $value 

[1] 0:3085375 


b) Calculer la probabilité qu'une vache quelconque de cette race produise entre 5900 et 6100 litres de 
lait par an. 


Solution : P(5900 < X< 6100) = 0,1974. 


c) Calculer la probabilité qu'une vache quelconque de cette race produise plus de 6250 litres par an. 
Solution : P(X> 6250) = 0,2660. 


2° Dans son futur troupeau, l’éleveur souhaite connaître : 
a) la production maximale prévisible des 30% de vaches les moins productives du troupeau. 
Il s’agit de déterminer la valeur x de X telle que P(X < x) = 0,30. 


Réponse : x 5790 litres de lait par an. 
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Certaines calculatrices et logiciels de calcul numérique proposent une fonction dédiée à ce type de 
calcul (qnorm() dans R pour normal quantile, FracNormale chez Texas pour fractiles de la loi normale, 
menu InN chez Casio pour loi normale «inverse». 


R TEXAS (83Plus) et + CASIO(35+) et + 
répartition normale répartition normale répartition normale 
réciproque pré programmée réciproque pré programmée réciproque pré programmée 
qnorm(.30, 6000, 400) FracNormale (.30,6000,400) menu stat  dist  NORM 
JT -5790:24 5790.24 InvN Area :.3 
& » 400 ; » : 6000. 
Inverse Normal x = 5790.2 


b) la production minimale prévisible des 20% des vaches les plus productives. 
Il s’agit de déterminer la valeur x de X telle que P(X > x) = 0,20. 

Réponse : x 6336 litres de lait par an. 

3. Processus industriel 


Poulie 
Le schéma ci-contre représente une pompe de direction assistée 
d’automobile. Le processus industriel étudié est une presse 
d’emmanchement de la poulie sur l’axe de la pompe. Les 
performances de la presse sont variables, cette variabilité ayant de 
nombreuses causes possibles : main d’œuvre, matériel, matière 
première. 

Sur le schéma ci-contre est spécifiée par le constructeur une cote de 


cote 39,9 mm 39,9 mm. 


On a mesuré cette cote sur 40 ensembles poulie-pompe issus du processus de fabrication en série. Les 
variations sont représentées sur le graphique suivant : 


40,05 


40 


1. Ce type de processus industriel induit la modélisation de la variable aléatoire « cote » par une 
variable suivant une loi normale W(u, o *)’. 


Donner par lecture graphique une valeur estimée !® de l’espérance # et de l’écart-type 6 à partir 
de la série des 40 valeurs. (Réponse : environ 39,9 et 0,05) 


$ Cet exemple est emprunté à la brochure IREM n° 112: Enseigner la statistique au lycée. 
? On peut vérifier la validité d’un tel modèle par des tests de normalité, mais c’est hors de propos ici. 


Ministère de l’éducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 14 sur 70 
Mathématiques - Probabilités et statistique 


http://eduscol.education.fr/proq 


2. L’intervalle de tolérance pour cette cote est de 39,9 +0,15. 


Donner, à l’aide des 40 mesures effectuées, une valeur approchée de la probabilité que la variable 
cote soit dans cet intervalle. (Réponse : environ 0,997). 


4. Masse d'alerte pour cartes de contrôle 

Une coopérative produit du beurre en microplaquettes de 12,5g pour des collectivités et des chaînes 
hôtelières. Les microplaquettes sont conditionnées dans des boîtes de 40. 

La masse des microplaquettes peut être modélisée par une variable aléatoire suivant une loi normale 
d’espérance u = 12,5 et de variance 6° = 0,2? et on admet que la variable aléatoire X égale à la masse 
d’une boîte de 40 microplaquettes suit alors une loi normale d’espérance # = 500 et de variance 
o = 1,6 (les notions relatives à la variance d’une somme de variables ne sont pas au programme, 
quelques notions sont abordées en annexe 2). 


La boîte est jugée conforme si sa masse est comprise entre 496,2 g et 503,8 g (soit environ 500 +36 ). 


1. Calculer la probabilité qu’une boîte prélevée aléatoirement en fin de chaîne de 
conditionnement soit non conforme. (Réponse : 0,003 à 10° près) 

2. Pour contrôler le réglage de la machine, on détermine des poids d'alerte u — h et u + h tels que 
P(u—-h<X<u+h)=0,99. Ces poids d’alerte sont inscrits sur une carte de contrôle et 
correspondent à une marge de sécurité en lien avec des normes de conformité. 


Calculer les poids d'alerte. 


Solution 


X —500 : ; Li 
Notons Z = ———. Z suit une loi normale centrée réduite donc nous savons que 


4/1,6 
P(— 2,58 <Z <2,58) = 0,99. Il ne reste plus, pour trouver u — h et u + h, qu'à résoudre 
u+h-—500 u—h-—500 


V6 VL6 


Grâce à des échantillons prélevés en sortie de chaine ces masses d’alerte permettent de déceler des 
anomalies en temps réel. 


= 2,58 et =—2,58 ce qui donne w+h#503,3 et u—-h#496,7. 


5. Réglage d'une machine d'embouteillage dans une coopérative 


Sur une chaîne d'embouteillage dans une brasserie, la quantité X (en cL) de liquide fournie par la 
machine pour remplir chaque bouteille de contenance 110 cL peut être modélisée par une variable 
aléatoire de loi normale de moyenne u et d’écart-type o= 2. 

La législation impose qu'il y ait moins de 0,1% de bouteilles contenant moins d'un litre. 


À quelle valeur de la moyenne y doit-on régler la machine pour respecter cette législation? 


Solution 


Il s’agit déterminer la valeur de telle que P(X< 100) < 0,001. On détermine d'abord la valeur z (on 
dit aussi quantile) de la loi normale centrée réduite, telle que P(Z < z) = 0,001. On trouve (logiciels ou 
calculettes) z=— 3,09. Comme Z=(#-—u)/2, il ne reste plus, pour trouver u, qu'à résoudre 
— 3,09 — (100 — u) / 2. On trouve u = 106,18. 


1 Il existe des méthodes d’estimation par intervalle de confiance de ces paramètres, mais ici il s’agit simplement 
d’une valeur empirique. 
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R TEXAS (83Plus) et + CASIO(35+) et + 
qnorm(p) est la FracNormale() est la 
fonction qui permet de fonction qui permet de InvN est le menu qui permet de 
trouver t tel que trouver t tel que P(T<t)#p, |trouver t tel que P(T<t)sp T 
P(T<t)+sp, T étant de T étant de loi normal étant de loi normale (c'est la 
loi normale (c'est la (c'est la répartition répartition normale réciproque 
répartition normale normale réciproque pré pré programmée) 
réciproque pré programmée) menu stat  dist  NORM  InvN 
programmée) FracNormale(.001,0,1) Area :.001 
qnorm(.001) <3,:0902323 ne ms 

[TJ =3,:090232 Inverse Normal x = -3.0902 


2° La contenance des bouteilles étant de 110 cL, quelle est alors la probabilité qu'une bouteille déborde 
lors du remplissage? 


Solution : Avec u = 106,18, on obtient P(X > 110) = 0,028. 


4° Le directeur de la coopérative veut qu'il y ait moins de 1% de bouteilles qui débordent au risque de 
ne plus suivre la législation. 


a) Quelle est alors la valeur de u? 


Solution 
Il s’agit cette fois de déterminer y tel que P(X > 110) < 0,01. On trouve u & 105,34. 


b) Quelle est dans les conditions de la question a) la probabilité que la bouteille contienne moins d'un 
litre? 


Solution 


Avec cette valeur de uw, on obtient P(X< 100) = 0,0038, ce qui est plus élevé que dans le cas 
précédent. 


c) Déterminer y et o afin qu’il y ait moins de 0,1% de bouteilles de moins d'un litre ET mois de 1% 
de bouteilles qui débordent. 


Solution 
On cherche donc à déterminer les valeurs de u et de o de sorte que : 
P(X< 100) <0,001 et P(X> 110) < 0,01. 
Les deux contraintes sur les probabilités fournissent les deux conditions suivantes. 
On détermine d'abord la valeur zx de la loi normale centrée réduite telle que P(Z> z;w ) = 0,01. On 
trouve (logiciels ou calculettes) zu © 2,33. 
On détermine ensuite la valeur 7; telle que P(Z < ziss) = 0,001. On trouve z;,5= — 3,09. 
Les deux contraintes se traduisent donc par les deux inégalités suivantes : 


DR à rss. 
© [02 


On obtient donc un domaine de solutions et une discussion pourra être menée quant aux choix 
pertinents que le directeur de coopérative pourrait faire. 


6. Durée de vie d’un appareil 


La durée de vie d'un certain type d’appareil est modélisée par une variable aléatoire suivant une loi 
normale de moyenne et d’écart-type inconnus. Les spécifications impliquent que 80 % de la 
production des appareils ait une durée de vie entre 120 et 200 jours et que 5% de la production ait une 
durée de vie inférieure à 120 jours. 


1. Quelles sont les valeurs de et o° ? 
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2. Quelle est la probabilité d’avoir un appareil dont la durée de vie soit comprise entre 200 jours 
et 230 jours ? 
Solution 
1. On note X la variable durée de vie. Les spécifications se traduisent par : 


P(120 < X <200)=0,8 et PCX <120)= 0,05. 


En notant toujours Z = eh la variable centrée réduite, on obtient : 
oz 
120 — 200 — 120 — 
ppt he ynet he et pire 204 Gps 
oz oz oz 


En utilisant logiciel ou calculatrice, on obtient : # = 120 +1,65 & et u = 200 — 1,04 ©. 


La résolution du système donne : 1 7169 et o? +884. 


2.  P(200<X <230)=P(X <230)-P(X < 200) +0,13 
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IV. Intervalle de fluctuation 
A. Cas binomial 
Soit X une variable suivant une loi 8 (n, p) et & un réel dans l’intervalle ]0, 1[. 


Dans un cadre général, tout intervalle [a,b] tel que : P(X ela,b) >1-« peut être considéré comme 
un intervalle de fluctuation de X au seuil 1—«. 


Ainsi l'intervalle [0,] est un intervalle de fluctuation évident au seuil 1 mais il est de toute évidence 
sans intérêt. 


On peut chercher : 


e celui qui a l’amplitude minimale (IF1) 


e le plus petit intervalle centré autour de l’espérance np comme dans le théorème de Moivre- 
Laplace (1F2) 


e celui qui symétrise les probabilités que X soit à l’extérieur, comme proposé dans le 
document ressource de première (1F3) 


e Dans le programme de seconde, on donne un intervalle de fluctuation approché au seuil 


n 


n 


0,95, valable sous certaines conditions, de la variable fréquence n 


nn. Ju 

À titre d’exemple voici les intervalles obtenus pour n = 100 et p =0,3 au seuil 0,95. 

eIF (1) le plus petit: [22, 39] de probabilité 0,9502 

e IF (2) centré sur 30 : [21, 39] de probabilité 0,9625 

e IF(3) (première) : [21, 39] avec une probabilité inférieure à 0,025 que X soit à gauche et 

inférieure à 0,025 que X soit à droite de l’intervalle. 

e IF(4) (seconde) : [20, 40] de probabilité 0,9710. 
On peut vérifier que, pour une même valeur de p, ces différents intervalles sont de plus en plus 
proches lorsque n augmente. 


B. Activité: recherche et utilisation d’un intervalle de fluctuation à l’aide d’un 
algorithme 


Le responsable de la maintenance des machines à sous d'un casino doit vérifier qu'un certain type 
de machine est bien réglé sur une fréquence de succès de 0,06. Pour cela il veut établir un programme 
qui lui fournira, en fonction de n (nombre de coups joués) et de p (probabilité de succès), un intervalle 
de fluctuation, au seuil de 95%, de la fréquence de succès. Cela lui permettra de prendre la décision de 
régler chaque machine pour laquelle il aura observé, dans l'historique des jeux, une fréquence de 
succès se situant en dehors de cet intervalle de fluctuation. 


1° Voici un exemple d'algorithme en Algobox et sa traduction dans le logiciel R permettant de 
déterminer l’intervalle de fluctuation d’une variable binomiale selon la méthode exposée dans le 
document ressource de première. 
e On cherche le plus petit entier a pour lequel P(X < a) est strictement supérieur à 0,025 et 
le plus petit entier b pour lequel P(X < b) est supérieur ou égal à 0,975. 
e Étant donné que a devient a + 1 en fin de « tant que », il faut faire afficher a — 1, et de 
même pour b. 
e Avec Algobox, cet algorithme ne fonctionne que pour n < 70. Avec le logiciel R il n'y a 
pas cette limite. Le programme R fournit la proposition de décision en fonction de la 
valeur observée (kobs) du nombre de succès. 
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2° Lors du contrôle d'une machine, le technicien constate qu'elle a fourni 8 succès sur 65 jeux, soit 
une fréquence observée de succès d'environ 0,12. L'intervalle de fluctuation de la variable fréquence 
fourni par l’un des deux programmes précédents est [0,015 ; 0,123]. Bien que la fréquence observée de 
succès soit de 0,12, la règle de décision n’amène pas à remettre en question le réglage de la machine. 


Si le même pourcentage de succès (0,12, kobs = 12) avait été observé sur 100 jeux, l'intervalle de 
fluctuation aurait été de [0,02 ; 0,11], ce qui aurait conduit à remettre en question le réglage de la 
machine. Le technicien aurait pris la décision de régler la machine. 


Algorithme Algobox : 


mu & W N 


_LA VALEUR 0 
0.025) FAIRE 

16 LA_VALEUR 0 

ALLANT DE O0 À a 

TT _POUR 

ND_LA VALEUR Frep+ALGOBOX_ LOI BINOMIALE(nN,p,i) 


R a+1 


975) FAIRE 


LA VALEUR Frep+ALGOBOX LOI BINOMIALE(n,p,i) 


a PREND_LA VALEUR a-1 
AFFICHER a 


END_LA VALEUR b-1 


# Fontion KR : 


# IF binomial doc. ressour. lère : 
(équilibré) en proba 
# n est la taille de l'échantillon, p est la 
probabilité de succès 
# kobs est le nombre de succès observé dans 
l'échantillon 
# proba est le seuil de probabilité de l'intervalle 
de fluctuation 
# a est le plus petit entier tel que P(X <= a) > 
0,025 
# b est le plus petit entier tel que P(X <= b) >= 
0,975 
IFexact2 = function(n = 65, p = .06, kobs = 8, proba 
= .95){ 
a <= À ; Bb <- 0 
repartil <- pbinom(0O:n, n, p, lower.tail = T) 
names (repartil) <- O:n 
pin£f <= 0 
while(pinf <= (1 - proba) / 2)1{ 
pinf <- pbinom(a, n, p, lower.tail = T) 
a: <= 6 + 2 } 
pin£f <= 0 
while(pinf < (1 - (1 - proba) / 2)){ 
pinf <- pbinom(b, n, p, lower.tail = T) 
b <- b + 1 } 
probaab <- sum(dbinom((a - 1):(b - 1), n, p)) 
if(kobs >= (a - 1) & kobs <= (b - 1)) !{ 
hypothese <- "ACCEPTÉE" } else 
{hypothese <-"REFUSÉE"} 
#x**x*xx*xxxAffichage des résultats et des 
graphiques****x#* 
cat("\nL'IF exact des comptages symétrique en proba 
est i\nl[”, 
a - 1,",",b - 1,"] de probabilité :", probaab, 
"\n\nL'IF exact des proportions symétrique en 
proba est :\n[", 


IF symétrique 


(a. 1) / n,;",%,46 - 4} / n;"1M\e", 
“Hypothèse p théorique = ", p, 
": confrontée à f observé =",kobs / n, " : ", 


hypothese,"\n") 


IFexact2(n = 50, p = 1/2, kobs = 19) 
IFexact2(n = 65, p = .06, kobs = 8) 

L'IF exact des comptages symétrique en proba 
est : 

[ 1 , 8 ] de probabilité 0.9668145 

L'IF exact des proportions symétrique en proba 
est : 

[ 0.01538462 , 0.1230769 ] 
Hypothèse p théorique = 
f observé = 0.1230769 


0.06 : confrontée à 
ACCEPTÉE 


Document associé : intervalle de fluctuation première.alg 


Le théorème de Moivre-Laplace va permettre de donner un intervalle de fluctuation calculable 
directement, sous réserve que n soit assez grand. Comme il est obtenu grâce à une convergence, on le 


qualifie d’intervalle de fluctuation asymptotique. 
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C. Intervalle de fluctuation asymptotique 
Théorème 


Si la variable aléatoire X, suit la loi 8 (#, p), avec p dans l’intervalle ]0, 1[, alors pour tout 
réel & dans l’intervalle |0, 1[ on a : 


POSE, 2 PA - p) 
Van 7 TT n 


X 
lim rl € a =1-a@ ,où 1, désigne l'intervalle! p-u, 
n—+0 n 
et 4, désigne l’unique réel tel que P (-u, LP< u,) =1-a où Z suit la loi normale #(0,1). 


Démonstration (exigible en terminale S) 


D’après le théorème de Moivre-Laplace, ona lim P(-u,, <Z, <u,)=P(-u, <Z<u,,) 
n—>+00 


Or: P(-u, <Z, <u,)=Plnp-u, npO = p}<X, <np+u, JnpQ = p)) 
-1 … VPü-n) x ae 
Ph Fe Dr = | 


t<p+u, 


n 7 
Application 


Quand on sait qu’une suite converge vers une limite L, on peut considérer que pour n assez grand le 
terme de rang n constitue une approximation de Z. 


Ici, on inverse les rôles. On connaît la limite, mais pas les valeurs des termes de la suite. 
On admet donc que, sous certaines conditions, on peut approcher le terme de rang n de la suite 


X _—. 
rer, par sa limite 1— a. 
n 


Ces conditions communément admises pour pratiquer l’approximation sont : 
n>30, np>5, n(1-p)>s. 


pu VD), NP 2) 
Vn Vn 


L’intervalle 7, = est un intervalle de  fluctuation 
n 


n 


n 


au seuil 1 — à. 


«approché » de la variable fréquence 


nñn 


n 


La suite de terme général P( 


e 1,) n’étant pas monotone, on ne peut pas savoir si la probabilité de 
l'intervalle est supérieure ou inférieure à la limite 1—« (cf note''). Cette situation peut être illustrée à 


l’aide d’un tableur ou du logiciel R. Voici un exemple dans le cas où p => et «a =0,05. Pour les 


n 


X : re 
appartienne à l’intervalle 7, . 
n 


valeurs de n entre 0 et 2000, on calcule la probabilité que la variable 


! Dans la pratique on parle de seuil 1-« , les écarts par rapport à cette limite étant minimes (voir fig 10). 
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On peut constater que le nuage de points obtenu a un aspect symétrique autour de la droite d’équation 
y = 0,95 et que lorsque n est grand les points se rapprochent de cette droite. 


IF asymptotique 


0,965 


lie 


0,945 
0,94 


0,935 


Figure 9: 


Lien vers : exploration intervalle de fluctuation asymptotique.xls 


Définition 


a est un 


Un intervalle de fluctuation asymptotique de la variable aléatoire F, — 
n 


intervalle déterminé à partir de p et de n et qui contient F, avec une probabilité d’autant plus proche 
de 1-@ que nest grand. L’intervalle 7, du théorème précédent est donc un intervalle de fluctuation 


asymptotique de F, au seuil 1 - œ 


Seul l’intervalle de fluctuation asymptotique au seuil de 95% est au programme des classes de 
terminale autre que la terminale S ; c’est celui qui est mis en œuvre dans l’exemple 1 ci-dessous. 
Remarque 

Quand n>30, np>5, n(1—-p)>5, il est courant de faire les calculs impliquant une variable 
binomiale en la remplaçant par une variable suivant une loi normale de mêmes espérance et variance. 


Seul le programme de STI2D-STL mentionne cette pratique, qui ne doit donc pas être mise en œuvre 
dans les autres filières où tous les calculs de probabilités se font à la calculatrice en utilisant la loi 
exacte (au programme), quelle qu’elle soit. 

Les calculs d’intervalles de fluctuation et d’intervalles de confiance se font avec les formules données 
dans le programme. 
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D. Exemples d’utilisation 


Dans les exemples qui suivent, les tirages sont effectués sans remise. Toutefois, la taille des 
échantillons considérés étant faible par rapport à la taille de la population totale, on apparente les 
tirages à des tirages avec remise, correspondant alors à un schéma de Bernoulli et permettant 
d’appliquer les résultats théoriques précédents. 


1. Prise de décision 


On admet que dans la population d’enfants de 11 à 14 ans d’un département français le pourcentage 
d’enfants ayant déjà eu une crise d’asthme dans leur vie est de 13%. 

Un médecin d’une ville de ce département est surpris du nombre important d’enfants le consultant 
ayant des crises d’asthme et en informe les services sanitaires. Ceux-ci décident d’entreprendre une 
étude et d’évaluer la proportion d’enfants de 11 à 14 ans ayant déjà eu des crises d’asthme. 

Ils sélectionnent de manière aléatoire 100 jeunes de 11 à 14 ans de la ville. 


La règle de décision prise est la suivante: si la proportion observée est supérieure à la borne 
supérieure de l’intervalle de fluctuation asymptotique au seuil de 95% alors une investigation plus 
complète sera mise en place afin de rechercher les facteurs de risque pouvant expliquer cette 
proportion élevée. 


1) Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la proportion de jeunes de 
11 à 14 ans ayant eu une crise d’asthme dans un échantillon de taille 100. (solution : [0,06 ; 0,20]) 


2) L’étude réalisée auprès des 100 personnes a dénombré 19 jeunes ayant déjà eu des crises d’asthme. 
Que pouvez-vous conclure ? 


Solution : la valeur 0,19 est à l’intérieur de l’intervalle de fluctuation asymptotique au seuil de 95%, 
On en conclut que la règle de décision choisie ne prévoit pas de réaliser une enquête supplémentaire. 


3) Le médecin n’est pas convaincu par cette conclusion et déclare que le nombre de personnes 
interrogées était insuffisant pour mettre en évidence qu’il y avait plus de jeunes ayant eu des crises 
d’asthme que dans le reste du département. 

Combien faudrait-il prendre de sujets pour qu’une proportion observée de 19% soit en dehors de 
l’intervalle de fluctuation asymptotique ? 


Solution : il faut et il suffit que la borne supérieure de l’intervalle asymptotique de fluctuation soit 


NOPRBET LG 40 , soit ñn >120. 
Vn 


La taille doit donc être de 121 sujets au minimum si on souhaite mettre en évidence une proportion 
anormalement élevée dans la ville étudiée. 


inférieure à 0,19 ce qui équivaut à 0,13+1,96 x 


4) Représenter graphiquement la taille de l’échantillon nécessaire en fonction de la valeur psup de la 
borne supérieure de l’intervalle de fluctuation au seuil de 95%. 


Solution 
1,96? x 0,13 x 0,87 


(psup- 0,13) 


L’expression de n en fonction de p sup est n = 
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0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,2 


borne superieure 


Figure 10 : Représentation de la taille nécessaire en fonction de la borne supérieure de 
l'intervalle de fluctuation asymptotique 


2. Problème de la surréservation (surbooking) 


Une compagnie aérienne possède des A340 (longs courriers) d’une capacité de 300 places. 
Cette compagnie a vendu n billets pour le vol 2012. 


La probabilité pour qu’un acheteur se présente à l’embarquement est p et les comportements des acheteurs sont 
indépendants les uns des autres. 


On note X, la variable aléatoire désignant le nombre d’acheteurs d’un billet se présentant à 
l’embarquement. 


La compagnie cherche à optimiser le remplissage de l’avion en vendant éventuellement plus de places 
que la capacité totale de l’avion (surréservation ou surbooking) soit ici n > 300. 


Comme il y a évidemment un risque que le nombre de passagers munis d’un billet se présentant à 
l’embarquement excède 300, la compagnie veut maîtriser ce risque. 


1. Déterminer la loi de X,. 


n 


n 


2. On suppose que 0,5< p <0,95. Écrire l’intervalle de fluctuation asymptotique Z, de 


au 


seuil de 0,95. 


3. Montrer que si /,€ jo 2e alors la probabilité que le nombre de passagers se présentant à 
n 


l’embarquement excède 300 est proche de 0,05. 


4. On cherche à déterminer la valeur de n maximale permettant de satisfaire la condition de 


l'inclusion 7, € LE 
n 


a. Montrer que 7, € L | > pn + 196Vn pA- p)-300<0. 
n 


b. Onpose f(x) = px+1,96Vx/p(1- p) -300. 
Montrer qu’il existe un entier n, unique tel que si n <n, alors f(n)<0etsin>n, 
alors f(n)>0. 


c. Tracer la courbe représentative de f pour les valeurs p = 0,85 ; p — 0,9 ; p — 0,95. 
d. Déterminer à la calculatrice les valeurs de n, pour p = 0,85 ; p = 0,9 ; p = 0,95. 
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3. 


Solution 


1. 


X, suit une loi binomiale de paramètres n et p. 


2. Comme n > 300 et 0,5< p <0,95 ona np>5 et n(1— p)>5 on peut utiliser l’intervalle 


de fluctuation asymptotique au seuil de 0,95 : 


1 =|p-196%P0 2) 196 PAP) | 
Vn Vn 


Si ie] alors P(X, > 300) <P[ 4 sl, 
n n 


X 
Comme r( Lg à & 0,05 alors on peut dire que PIX, > 300) est proche également de 
n 


0,05 voire inférieur (l’événement (4,>300) étant inclus dans la partie droite du 
complémentaire de /, on pourrait vérifier avec le tableur que sa probabilité est en fait 
inférieure à 0,05 pour n > 300 et 0,5< p <0,95). 


1— 
a. y co Lo P) 2508 
: Ke 


== np +1,96Vn/p(1- p) -300 <0 
n 


n 


b. En posant y = Vx , On se ramène à une inéquation du second degré que l’on résout pour 
x 2300. 


Les solutions de l’inéquation f(x) <0 sont donc les réels de l’intervalle [300, x| où 


2 
_ DE +,/1200p +1,96 p(1- p) | 
0 Me Se . 
2p 


L’entier r, cherché est la partie entière de x,. 


c. p = 0,85 en bleu, p = 0,9 en rouge, p = 0,95 en vert. 


d. Pour p 0,85 on trouve n,= 337, 
Pour p = 0,9 on trouve n,= 321, 
Pour p = 0,95 on trouve n,= 307. 


Echantillon représentatif d’une population pour un sondage 
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La première partie de l’activité proposée page 29 peut être traitée dans ce cadre. 


En vue de conduire une enquête sur certaines caractéristiques physiologiques d’une population, un 
échantillon de personnes a été sélectionné et on souhaite en conforter la représentativité. 


E. Intervalle de fluctuation simplifie donné en seconde 


On reprend les notations du paragraphe C. Dans le cas où & =0,05 ,ona u, +1,96. 


le. 
La fonction pH p(1- p) admet un maximum pour p = = égal à pk 


VpA- p) 1 
Vn 
D-196 PP) 196 VP0 2) 
Vn Vn 


On peut donc majorer u,, 


On en déduit que l’intervalle J, = (approximation de 


: Li : S 1 1 
l'intervalle 7, liée à l’approximation de u,,5 par 1,96) est inclus dans l’intervalle | P dr P ed 
n n 


et donc on a : 


IA 


X 
P( +eJ,)<P(p- : 
n 


Cette inégalité prouve que l’intervalle | P | est un intervalle de fluctuation asymptotique 


nn 
Va \n 
à un seuil au moins égal à celui de l’intervalle J, (proche de 0,95) et justifie le résultat énoncé en 


seconde sous une forme simplifiée, ne prenant pas en compte le caractère asymptotique. 


1 1 
e—, + — 
Fr 


prenne ses valeurs dans cet 


Compte tenu du caractère asymptotique de l’intervalle de fluctuation | | il serait 


ñn 


n 


inexact d’affirmer que la probabilité que la variable aléatoire 


intervalle est supérieure à 0,95 pour toute valeur de n, même lorsque les conditions usuelles 
d’approximation sont vérifiées. Ce point a déjà été clairement explicité dans le document ressource de 
la classe de première. Nous le reprenons ici. 


n 


D de : Le il 1 : 
On peut visualiser ci-dessous les valeurs des probabilités are <p+——) suivant les 
n n n 


valeurs de p et de n et constater que le résultat énoncé en classe de seconde, s’il n’est pas tout à fait 
exact, fournit néanmoins en général une probabilité très proche de 0,95, ce qui justifie son utilisation 
dans la pratique. 
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Exploration de l'intervalle de fluctuation : influence de n avec p = 0.3 Exploration de l'intervalle de fluctuation : influence de n avec p = 0.5 
a+ 8 
a 81° o 8) 
| 8 © | 
El & : 
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Figure 11 : Visualisation des probabilités de l’intervalle de fluctuation de seconde pour p = 0,3 
(figure de gauche) et p = 0.5 (figure de droite). 


Document associé : intervalle de fluctuation seconde.r 
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On peut constater que : 
E. _ #, Il _— : 
pour p —0,3 P(p-—<—"<p+——)2>0,95 semble vérifiée pour tout entier n, 
\n on Vn 


1 XX il ; | 
pour p =0,5 P(p-—<—<< p+ =) 20,95 semble être vérifiée pour tout entier n > 600. 
n n n 


Cela conduit au résultat suivant : 


Théorème 
Si la variable aléatoire X, suit la loi 8 (n, p) alors, pour tout p dans |0, 1[, il existe un entier 


L>0,95. 
n 


Jn 


X, 
<p+ 


1 
< 
à 


n, tel quesi n>n, alors P(p- 


EDémonstration 

Pour une variable binomiale X, de paramètres n et p, le théorème de Moivre-Laplace prouve que, en 
notant Z, la variable centrée réduite associée à X,, la limite de a, =P(-2<7Z, <2) est égale à 
2P(Z <2)-1 où Z suit une loi W(0,1). 


Orona L=2P(Z <2)-120,9544. 


Donc, pour € < 0,004, si on considère l’intervalle ouvert LL — &,L + contenant Z, il existe un 
entier n, telquesin>n,ona:a,elL-e,L+e| donc a, >0,95 puisque L—£ > 0,9504. 


2 X 2 
Or a, Pr . Jp(- p) < = < DATE) ce qui donne, en majorant p(1-— p) par 
n n 


1/4, un intervalle de fluctuation plus large donc de probabilité supérieure ou égale à a, . 


1 X 1 
Donc pour tout entier 1>n,,0na: Plp- 7 <p+)e0ss 


Vn on Vn 


Exemple d’activité 

Selon la valeur de p, la valeur de ñ4Ç peut varier considérablement. 

Il est d’ailleurs difficile de déterminer avec certitude cette valeur de r,. On peut cependant donner des 
valeurs de ñ, grâce à un algorithme de calcul. 


P 0,35 0,36 0,37 0,38 0,39 0,4 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,5 


n) | 31 30 36 64 56 81 90 120 143 209 271 288 304 399 399 529 


On peut remarquer que la plus grande valeur de 7, est atteinte pour p =1/2. C’est effectivement 


pour cette valeur que la fluctuation est la plus importante puisque la variance est maximale pour cette 
valeur de p. 
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Algorithme Algobox : Programme SCILAB : 

Remarque : Cet algorithme ne permet d’obtenir | Remarque : La ligne 12 enlève 1 à la première 
n, que pour des valeurs de p entre 0 et 0,39 car | valeur de n pour laquelle Fsup — Finf < 0,95. Or, on 
Algobox ne calcule pas de valeurs avec la loi|cherche la plus petite valeur den,çà partir de 


binomiale pour des valeurs de # supérieures à | aquelle FSup-Finf>95 donc on doit faire afficher 
70. Or pour p2Z0,4 la valeur de 7" est|n+2. 


supérieure à 80. Pour le cas général il faut 
utiliser les logiciels R ou Scilab par exemple. 


Document associé : recherche du n0.alg Document associé : recherche du n0.sce 
(F VARIABLES 1 
L- n EST_DU_ TYPE NOMBRE Ë 
L pb EST DU TYPE NOMBRE 2 [p-input("p="); 
inf EST_DU_ TYPE NOMBRE . : 
L Sup EST_DU_ TYPE NOMBRE 3 |n-1000; 
+ Finf EST_DU_ TYPE NOMBRE 4 
 Fsup EST_DU TYPE NOMBRE . 
Li EST_DU_ TYPE NOMBRE S JFinf=0; 
r j EST_DU_TYPE NOMBRE 1. 
— n0 EST_DU_TYPE NOMBRE 6 Fsup 1; 
M pete in 7 [while Fsup-Finf>=0.95 
URE p des 
En PREND_LA VALEUR 69 8 inf=floor(n*p-sqrt(n)); 
- Finf PREND_LA VALEUR 0 9 sup=floor (n*p+saqrt(n)); 


-- Fsup PREND_LA VALEUR 1 

# TANT QUE (Fsup-Finf>=0.95) FAIRE 

L_ DEBUT_TANT_QUE 

 Inf PREND_LA VALEUR floor(n*p-sgrt{n}} 
+ Sup PREND_LA VALEUR floor{n*p+sqrt(n)} 


o 


Fsup=-cdfbin("PO",sup,n,p,1-p); 
Finf=cdfbin("PoO",inf,n,p,1-p); 


— 
ren 


12 n=n-1l; 
-- Finf PREND_LA VALEUR 0 
+ Fsup PREND_LA VALEUR 0 13 end 
# POUR i ALLANT_DE 0 A Inf 
+ DEBUT_POUR 14 2sp(n+2); 


+ Finf PREND_LA_ VALEUR Finf+ALGOBOX _LOI_BINOMIALE(N.p.i) 
L FIN_POUR 

# POUR j ALLANT_DE 0 À Sup 

DEBUT_POUR 

Fsup PREND_LA VALEUR Fsup+ALGOBOX_LOI_BINOMIALE(n.p.j) 
L_ FIN_POUR 

En PREND_LA VALEUR n-1 

L FIN TANT QUE 

E- n0 PREND_LA VALEUR n+2 

L_ AFFICHER n0 

FIN_ALGORITHME 


on 


Exemples d’exercices 


1. Les enfants sont dits prématurés lorsque la durée gestationnelle est inférieure ou égale à 259 jours. 
La proportion de ces naissances est de 6%. Des chercheurs suggèrent que les femmes ayant eu un 
travail pénible pendant leur grossesse sont plus susceptibles d’avoir un enfant prématuré que les 
autres. Il est décidé de réaliser une enquête auprès d’un échantillon aléatoire de 400 naissances 
correspondant à des femmes ayant eu pendant leur grossesse un travail pénible. Les chercheurs 
décident a priori que si la proportion d’enfants nés prématurés dans cet échantillon est supérieure à la 
borne supérieure de l’intervalle de fluctuation asymptotique au seuil de 0,95 alors leur hypothèse sera 
acceptée. Finalement le nombre d’enfants prématurés est de 50. Quelle est donc la conclusion ? 


Solution : Sous l’hypothèse que la proportion de prématurés dans l’échantillon est la même que dans la 
population générale, on détermine l’intervalle de fluctuation asymptotique au seuil 0,95. 


0,06-1,96 x VOX 5 96+1,96x VUXÈA | LL 037:0,083] 
V400 V400 


On calcule la valeur observée de proportion de prématurés dans l’échantillon et on obtient 0,125. Cette 
valeur n’appartient pas à l’intervalle de fluctuation asymptotique au seuil de 95%, donc avec la règle 
de décision choisie, on rejette l’hypothèse posée. Les chercheurs concluent donc que la proportion 
d’enfants prématurés est plus élevée chez les femmes ayant eu un travail pénible pendant leur 
grossesse. 
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2. 1) Vérifier que l’intervalle [—-2,576 , 1,696] peut être considéré comme un intervalle de fluctuation 
au seuil de 95% d’une variable X suivant une loi W(0,1) (c'est-à-dire que P(X € 7) 70,95). 


2) Montrer qu’il existe une valeur a minimale telle que l’intervalle [- a,a| soit un intervalle de 
fluctuation au seuil de 95% de X. En donner une valeur approchée à 10° près. 

3) Montrer qu’il existe un unique réel b tel que P(—-2< X <—2+b)= 0,95. 

Prouver que b < a +2 où a est la valeur de la question 2). 

Déterminer une valeur approchée de b à 107? près. 

4) Montrer qu’il n’existe aucun réel c tel que P(—-1< XX <—-1+c)=0,95. 


Solution 
1. Avec une calculatrice : P(—2,576 < X < 1,696) = 0,95006 > 0,95 


2. P(-a<X<a)=2 Fe (dt = F(a) 


: . 2 

On étudie la fonction F. Sa dérivée est F'(x) = Re 
T 

Donc F est strictement croissante de [O, +00| vers [o.1[ . Il existe donc un réel a unique tel que 

F(a)=0,95. 

D’après ce qui a déjà été vu, a vaut environ 1,96. 


3. PC2<X<-2+x)= b” fOdt = H(). 


oi 


_— (x-2} 


Cette fonction est strictement croissante car sa dérivée est égale à : 
V2T 
ÿ 
Comme (4) = [es f(bdt > F(1,96), il existe b unique tel que H(b)=0,95. 
—a —2+b —2+b —a 
On a 0,95 = H(b)= L f(Odt +0,95 + Ï f(bdt donc ( f(Odt =- L (dt <0 
donc a>-2+b. 


A l’aide de la calculatrice, en utilisant la fonction qui à x fait correspondre P(—-2<X# <-2+x), 


on trouve 3,92 < b < 3,93. 
On peut vérifier que l'intervalle [-a,a] est plus court que l’intervalle [-2,-2+b|. 


—1+c 0 —1+c 0 1 
a. [rod fo&+f  ro<f FOdr+S. 
Or [” f(Odt < 0,35 donc | f{Ddr <0,85 pour tout c 


Remarque 
On peut démontrer plus généralement que l’intervalle de fluctuation au seuil de 95% centré en 0 
est celui d’amplitude minimale. 
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V. Intervalle de confiance 


A. Introduction 


Il est souvent difficile pour des raisons à la fois financières et logistiques de pouvoir recueillir des 
données sur la population toute entière. Le plus souvent, on se contente de travailler sur un 
échantillon, c’est à dire une fraction ou sous-ensemble de cette population. Ceci présente bien sûr des 
avantages en termes de faisabilité et de coût, mais impose des contraintes pour que l’information 
recueillie au niveau de l’échantillon (estimation) soit la plus proche possible de celle de la population 
entière (paramètre). La démarche pratique est donc la suivante : 


e on sélectionne un échantillon de la population que l’on étudie, on appelle cela 
l’échantillonnage. 


e On vérifie, selon les cas, à partir d’intervalles de fluctuation que l’échantillon ainsi obtenu est 
« représentatif » de la population pour des critères qui sont connus dans la population. 


Echantillonnage : sélectionner un échantillon de taille n par 
1 tirage au sort de la population 

Déterminer les intervalles de fluctuation à partir des 

informations connues dans la population ou fixées 


Echantillon 


Population 


1) On calcule la fréquence de 
femmes f. 

S1f est dans l’intervalle de 
fluctuation de p, l’échantillon 
est dit représentatif de la 
population pour ce critère au 
seuil I-&. 

2) On calcule la 
fréquence de 
personnes ayant la 
maladie M, notée fy. 


On connait par exemple 
- la proportion p de femmes 


On ne connait pas 
- la proportion p,, de personnes ayant la 
maladie M. 


Estimation : à partir des données de l’échantillon on estime les 
2 paramètres inconnus de la population par l’intervalle de confiance 
au niveau de confiance de 1-«. 


Figure 13 : Principe de l’échantillonnage 
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La notion d’échantillon représentatif est une question délicate, en particulier lorsqu’elle concerne des 
personnes dans le cadre d’un sondage. Elle l’est clairement moins lorsqu'il s’agit d’un échantillon de 
pièces dans une chaine de fabrication. Cette notion d’échantillon représentatif est évoquée ici afin de 
contextualiser un peu l’activité mais ne constitue en aucun cas un objectif du programme. 


Il convient également de souligner que, dans les sondages, les tirages sont pour la plupart effectués 
sans remise mais peuvent s’apparenter à des tirages avec remise dès que la taille de l’échantillon est 
petite devant la taille de la population totale, ce qui est le cas dans les sondages classiques. 


On peut d’ailleurs observer que dans le cas contraire, l’intérêt de ne questionner qu’un échantillon 
diminue. 


L'activité qui suit propose une situation de sondage simplifiée qui ne correspond pas exactement aux 
techniques réelles de sondage. Quelques compléments d’informations sur les techniques de sondage et 
les questions qu’elles soulèvent figurent en annexe 3, à titre informatif. 


Activité 


On souhaite estimer la prévalence du surpoids dans une ville V, c'est-à-dire la proportion de personnes 
ayant une masse trop importante par rapport à leur taille. Pour cela 460 personnes ont été sélectionnées 
de manière aléatoire à partir de la liste des logements connue par la municipalité, c'est-à-dire que le 
fait d’avoir été sélectionné pour participer à l’étude est uniquement dû au hasard. On admet que cette 
procédure permet d’assimiler la sélection des personnes interrogées à un schéma de Bernoulli. 


Un enquêteur s’est déplacé au sein de chaque logement après avoir convenu d’un rendez-vous afin de 
recueillir les informations nécessaires à l’enquête. 


1° Dans un premier temps, l’enquêteur va s’assurer que l’échantillon est représentatif de la population 
qu’on étudie sur des informations qu’on peut vérifier et qui sont en lien avec le critère étudié. Dans le 
cas présent on peut connaître par exemple la proportion d’hommes et de femmes dans la population de 
la ville, ainsi que la répartition selon l’âge en demandant à la municipalité qui se référera aux 
informations du recensement. Parallèlement on peut comptabiliser le nombre d’hommes et de femmes 
dans l’échantillon ainsi que la répartition selon l’âge. 


Homme Femme Total 
Echantillon 200 260 460 
< 60 ans > 60 ans Total 
Echantillon 352 108 460 


On sait que, dans la population, il y a 46% d’hommes et 20% de personnes de plus de 60 ans. 


a) Déterminer l’intervalle de fluctuation asymptotique au seuil 0,95 de la variable aléatoire 
«proportion de femmes » dans un échantillon aléatoire de taille 460 sélectionné au sein de la 
population de cette ville. 

b) Calculer la proportion de femmes dans l’échantillon et vérifier si cette valeur appartient à 
l'intervalle de fluctuation. 

c) Déterminer l’intervalle de fluctuation asymptotique au seuil 0,95 de la variable aléatoire 
«proportion de personnes âgées de plus de 60 ans » dans un échantillon aléatoire de taille 460 
sélectionné au sein de la population de cette ville. 

d) Calculer la proportion de personnes de plus de 60 ans dans l’échantillon et vérifier si cette 
valeur appartient à l’intervalle de fluctuation. 

e) Si pour chacune des variables, genre et âge, l’intervalle de fluctuation asymptotique au seuil de 
95% contient la valeur de l’échantillon on considère que l’échantillon est représentatif de la 
population pour cette information. Quelle est donc la conclusion pour le cas étudié ici ? 
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2° La première étape de ce travail a donc été de sélectionner un échantillon qui soit accepté comme 
«représentatif » de la population. Aïnsi les informations qui seront obtenues à partir de cet échantillon 
seront généralisables, avec un certain nombre de précautions, à l’ensemble de la population dont il est 
extrait. Dans le cas de l’étude présentée ici, on souhaite estimer la proportion de personnes en 
surpoids ; pour cela il est tout d’abord important de définir le surpoids. La définition du surpoids 
donnée par l'OMS (Organisation Mondiale de la Santé) est la suivante : une personne est considérée 
en surpoids si son IMC (Indice de masse corporelle) est supérieur à 25. L’IMC se calcule de la 
manière suivante : masse en kg/(taille en m}. 


La proportion de personnes en surpoids dans l’échantillon étudié est de 29,5%. Comme il s’agit d’un 
calcul réalisé à partir des données d’un échantillon on sait que cette valeur ne correspond pas 
exactement à la valeur de la prévalence dans la population, car si nous avions pris un autre échantillon 
nous aurions obtenu une autre valeur. Pour cette raison il est nécessaire de communiquer un intervalle 
qui sera obtenu à partir des informations observées et pour lequel on puisse dire avec un « niveau de 
confiance » supérieur à 0,95 qu’il contient la vraie valeur de la prévalence du surpoids dans la ville. Si 
f est la fréquence observée dans l’échantillon une expression de cet intervalle, qui sera appelé 


Il Il 
E 


classe de seconde, prend tout son sens en terminale et est démontré en terminale S. 


intervalle de confiance, est | | où n est la taille de l’échantillon. Ce résultat, évoqué en 


Déterminer un intervalle de confiance au niveau de confiance de 95%. 


Solution : 
1° a) L’intervalle de fluctuation asymptotique au seuil de 95% est déterminé par : 


p 196 TR. p 9 TP = [0,49 ; 0,59]. 
n n 


b) La proportion de femmes dans l’échantillon est égale à 56,5%, cette valeur appartient à l’intervalle 
de fluctuation calculé ci-dessus. 


c) On obtient avec un calcul analogue à celui de la question a) l’intervalle [0,16 ; 0,24] 


d) La proportion de plus de 60 ans dans l’échantillon est égale à 23,4%, cette valeur appartient à 
l'intervalle de fluctuation calculée ci-dessus. 


e) On considère que l’échantillon observé est représentatif de la population pour les deux critères 
retenus (genre et âge). 


La représentativité sur deux critères ne signifie évidemment pas la représentativité sur tous les critères 
et dans tous les cas, il est peu vraisemblable qu’un échantillon de 460 sujets soit représentatif pour 
tous les critères. Les résultats obtenus sur un échantillon ne peuvent pas remplacer les résultats exacts 
d’un recensement. Cependant la vérification précédente sur des critères importants permet de 
considérer que l’échantillon retenu est structuré comme la population étudiée, au regard de certains 
critères. 


2° L’intervalle de confiance calculé au niveau de confiance de 95% est donc : 
Il Il 

0,295 — >; 0,295 + ——— 

| V460 


V460 


Cet intervalle fournit une estimation par intervalle de la prévalence du surpoids dans la ville étudiée. 


| [0,25:0,34] 
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B. Principe général de l’intervalle de confiance 


Étant donné un paramètre p, ici une proportion inconnue, d’une population, la procédure d’estimation 
consiste à utiliser les informations recueillies dans un échantillon sélectionné de manière aléatoire 


pour obtenir une valeur de la variable aléatoire fréquence F, = destinée à fournir une estimation 
n 


de p. Mais on sait que cette estimation va varier d’un échantillon à l’autre, de par la fluctuation 
d’échantillonnage, autour de p. Il est donc nécessaire d’apprécier l’incertitude en fournissant une 
estimation par intervalle, appelé intervalle de confiance de p. Cet intervalle est obtenu en fonction 
d’un coefficient lié au niveau de confiance que l’on accorde à cette estimation. 


Lorsque n>30 et np >5 et n(1l-p)>5, la formule fournit un intervalle de 


n 


fluctuation de F, =—" au seuil 0,95. 


Supposons que p soit inconnu . On peut approcher p par la proportion f obtenue par les données de 
l’échantillon et déterminer un intervalle de confiance de p au niveau de confiance 0,95. 


Selon le théorème du paragraphe IV-C, on sait que, pour # suffisamment grand, on a : 


L À 1 
P(p << p+——)20,95. 
Vn on Vn 
1 il —— ; 1 1 ; 
Comme p-——<F,<p+—— équivaut à F,-—<p<F,+—=, on peut également 
\n n n Vn 
| 1 1 | 
écrire P(F, -—<p<F,+——) 20,95, ce qui peut se traduire en disant que : 


n Vn 


l’intervalle aléatoire E 


il il 

n _ —;F?, EL En 

Va" Vn 

ï il il 

À partir de l’intervalle aléatoire | F, -—=,F, + — 

| Va" \n 

échantillon, une réalisation de cet intervalle qui fournit alors un intervalle numérique de la forme 
Il Il 

er 

| Va \n 


Si l’on fait un très grand nombre de tirages, on sait que théoriquement on devrait'? avoir pour au plus 


| a une probabilité au moins égale à 0,95 de contenir p. 


| on obtient, en effectuant le tirage d’un 


5% d’entre eux des intervalles ne contenant pas la proportion inconnue p. 


C. Définition 
Un intervalle de confiance pour une proportion p à un niveau de confiance 1-a est la réalisation, 
à partir d’un échantillon, d’un intervalle aléatoire contenant la proportion p avec une probabilité 


supérieure ou égale à 1—a. Cet intervalle aléatoire est déterminé à partir de la variable aléatoire 


F,=—" qui, à tout échantillon de taille n, associe la fréquence. 
n 


Le cas particulier où 1— & = 0,95 est le seul au programme. 


711 s’agit toujours d’un nombre fini de réalisations et il peut y avoir plus de 5% d’entre elles qui ne contiennent 
pas p. 
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Remarque 1 


En réalisant le tirage d’un échantillon, on obtient un intervalle de confiance de la forme 


Ainsi, à chaque tirage d’un échantillon, on obtient un intervalle de confiance différent. 


fee la proportion inconnue p à un niveau de confiance de 0,95. 


Remarque 2 


Un intervalle de confiance étant un intervalle numérique, il est incorrect de conclure la détermination 


d’un intervalle de confiance par une phrase du type « p a une probabilité de 0,95 d’être entre f — 2 


Vn 


et f+—— » car il n’y a plus d’aléatoire à ce stade. Il est en revanche convenable d’écrire : 


Vn 


1 1 .  : à 
«L’intervalle | f tr. f + est un intervalle de confiance de la proportion inconnue p au niveau 
n n 


de confiance 0,95 ». 


D. Intervalle de fluctuation ou intervalle de confiance : lequel utiliser ? 
Règle générale 
On utilise un intervalle de fluctuation lorsque la proportion p dans la population est connue ou si l’on 
fait une hypothèse sur sa valeur. 


On utilise un intervalle de confiance lorsque l’on veut estimer une proportion inconnue dans une 
population. 


Exemple 1 


Test de conformité d’une proportion : on veut déterminer si la proportion observée dans un 
échantillon est conforme à une valeur de référence connue dans la population. 


Sous l’hypothèse que l’échantillon est issu d’un tirage aléatoire correspondant à un schéma de 
Bernoulli (tirage avec remise ou s’y apparentant), la variable fréquence F, appartient à un intervalle 
de fluctuation avec une probabilité déterminée. 


En fonction de l’appartenance ou non de la fréquence observée à cet intervalle, on peut prendre une 
décision concernant la conformité de l’échantillon. 


Si les conditions d’utilisation sont réunies, on détermine l’intervalle de fluctuation asymptotique, sinon 
on a recours à un intervalle de fluctuation calculé avec la loi binomiale. 


Exemple 2 


Estimation d’une proportion inconnue râce à un échantillon aléatoire 
P 


On se place dans le cas où l’échantillon comporte au moins 30 éléments afin de pouvoir utiliser 
l’intervalle de confiance au programme. 


Si la fréquence observée f'est telle que nf >5 et n(1- f)>5,on considère qu’on peut conclure qu’un 
intervalle de confiance de p au niveau de confiance 0,95 est | 


Le tableau suivant récapitule ce qui est au programme de chaque classe du lycée. 
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Intervalle de fluctuation Intervalle de confiance 
p connue D inconnue 


n >25 et 0,2< p <0,8, seuil 95% 


SECONDE 1 Il Sensibilisation 
br 
PREMIÈRE Avec la loi binomiale 

n>30etnp>Setn(l-p)>5 Au Mu 


Asymptotique au seuil 1-@ 


TERMINALE 24 
np ED peu, VD] E Rs) 
n n 


En terminale autre que S, a =0,05 donc w, =1,96. 


E. Autre intervalle de confiance 


Il existe d’autres manières de déterminer un intervalle de confiance d’une proportion. 
Dans les commentaires du programme, il est signalé que dans d’autres champs disciplinaires on utilise 


l'intervalle | #-196%7 mn f) ro | 
n n 


La justification de cet intervalle est hors programme. 


Exemple 
Pour un niveau de confiance de 0,95, on a w, = 1,96. Si sur un échantillon de taille 100 on observe 


une valeur de la fréquence égale à 0,44, l’intervalle de confiance de p au niveau 0,95 obtenu avec la 
formule précédente est [0,343 ; 0,537]. 


Il 
L’intervalle ed donne [0,34 ; 0,541]. 


F. Étude de la longueur de l'intervalle de fluctuation et conséquence pour l’intervalle 


de confiance 
VP(- p) _— VP(- p) 
no TT n 


L’intervalle de fluctuation asymptotique 7, = | pu, a pour 


Foi — 
longueur 2u, JPA pr) Donc pour a et n fixés, la longueur de Z, varie comme ./p(1- p). Elle 


Nr 1 


1 
est donc maximale quand p = 3 et d’autant plus faible que p est proche de 0 ou de 1. 


VrÜ- p) 
———— pour nr =1000 : 
Vn 


Quelques valeurs de la longueur 2u,, 


p=0,1l p=0,3 p=0,4 p=0,5 

a= 0,05 0,037 0,057 0,061 0,062 

a= 0,01 0,049 0,075 0,08 0,082 
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Conséquence pour l'intervalle de confiance 


Si on cherche à estimer par intervalle, au niveau de confiance 0,95, une valeur de p dont on sait qu’elle 
est plutôt proche de 0,5 (cas du second tour de l’élection présidentielle), on a un intervalle de 
confiance, appelé dans ce cas fourchette de sondage, d’amplitude proche de 0,06. 


Si on cherche à estimer une valeur de p sans doute inférieure à 0,1 (cas des petits candidats du premier 
tour), on a une fourchette d’amplitude proche de 0,04. 


On constate sur le tableau précédent que, n étant fixé, l’augmentation du niveau de confiance 
augmente simultanément la longueur de l’intervalle de confiance, ce qui est un résultat général facile à 
justifier (et à concevoir). 


G. Détermination de la taille minimale de l’échantillon pour avoir une précision donnée 


On étudie d’abord la taille minimale de l’échantillon pour avoir une longueur donnée a de l’intervalle 
de fluctuation pour un seuil ou un niveau de confiance fixé. 


1) Avec l’intervalle asymptotique de seconde (donc & = 0,05 et pour tout p) 


2 à 4 
On cherche n tel que. Ke < a ce qui équivaut à n 2 —. 
n a 


Quelques valeurs : 
Valeur de a 0,06 0,04 0,02 0,01 


Valeur de n 1112 2500 10000 40000 


Conséquence pour la taille de l’échantillon nécessaire pour obtenir une amplitude de l’intervalle 
de confiance fixée 


1 X Il X 1 X 1 
Ona: {ps les p+ te ]2095 Pl L——<p< 7 )2055 
Vn on Vn n Vn nn 
L’amplitude de l’intervalle de fluctuation est évidemment la même que celle de l’intervalle de 
confiance. 


Donc, avec un niveau de confiance de 0,95, pour obtenir un intervalle de confiance d’amplitude 0,06, 
il faut un échantillon de taille 1112 au moins. 


Eee. VP(- p) 
NO 


2) Avec l’intervalle asymptotique 7, = | D, 


Vp(A- Au ? p(1— 
On cherche n tel que 2u,, vd 0) <a ce qui équivaut à n > a PAP) 
Vn a 
Donnons quelques valeurs : 
Pour p = 0,5 
Valeur de a 0,06 0,04 0,02 0,01 
Valeur de n si & = 0,05 1067 2401 9604 38416 
Valeur de n si æ—=0,01 1849 4161 16641 66664 
Pour p = 0,1 
Valeur de a 0,06 0,04 0,02 0,01 
Valeur de n si æ = 0,05 385 865 3458 13830 
Valeur de n si æ= 0,01 666 1498 5991 23964 
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H. Applications 
1. Exemple de détermination d’un intervalle de confiance 


Prenons un cas très classique : un sondage politique précédant le premier tour d’une élection 
présidentielle. 

Le 18 avril 2002, l'institut IPSOS * effectue un sondage dans la population en âge de voter. 

On constitue un échantillon de 1000 personnes (inscrites sur les listes électorales) que l’on suppose 
choisies ici de manière aléatoire. Ce n’est pas le cas en pratique (voir plus loin le paragraphe 
«sondages ») mais le principe reste le même que dans cet exemple. 

Les résultats partiels en sont les suivants : 

Sur les 1000 personnes 

135 ont déclaré vouloir voter pour Jean-Marie Le Pen 

195 ont déclaré vouloir voter pour Jacques Chirac 

170 ont déclaré vouloir voter pour Lionel Jospin. 

On peut déterminer trois intervalles de confiance au niveau de confiance de 95% * : 

Jean-Marie Le Pen [0,135-0,032 ; 0,135+0,032] = [0,103 ; 0,167] 

Jacques Chirac [0,195—0,032 ; 0,195+0,032]-[0,163 ; 0,227] 

Lionel Jospin [0,170—0,032 ; 0,170+0,0321-[0,138 ; 0,202]. 

Donc la valeur unique en pourcentage donnée par l’institut est entachée d’une imprécision de +/-3 
points. En examinant les trois intervalles trouvés, on peut a posteriori dire que le vrai résultat 
(16,9%,19,9%,16,2%) est compatible avec ceux-ci pour Jacques Chirac et Lionel Jospin car leurs 
résultats sont dans les intervalles correspondants. En revanche, le résultat de Jean-Marie Le Pen est 
légèrement supérieur à la borne supérieure de son intervalle de confiance (mais l’institut CSA lui 
donnait 14%, ce qui donne un intervalle [0,108 ; 0,172] qui contient son score réel). 


2. Simulations 


Le graphique ci-dessous donne 100 intervalles de confiance simulés au niveau de confiance 0,95 
obtenus à partir de 100 échantillons de 50 individus extraits de la même population. 


Intervalles de confiance au niveau 95%, d'une proportion dans la population 
calculés à partir de 100 échantillons simulés, de taille 50 


proportion de succès dans l'échantillon 


T T T T T T 
0 20 40 60 80 100 


100 simulations 


Figure 14 
Document associé : intervalles de confiance simulés.r 


1 On peut consulter le site www.ipsos.fr/faq pour des détails sur les méthodes utilisées par cet institut. 
Pour chaque candidat, on applique la méthode précédente pour déterminer un intervalle de confiance de la 
proportion d’électeurs lui étant favorables. 
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On peut constater sur la figure 14 une fluctuation importante des bornes des intervalles de confiance 
numériques obtenus à chaque simulation. 

Remarque : Les échantillons étant de taille 50, il y a exactement 51 valeurs possibles de la fréquence 
ce qui explique que l’on retrouve plusieurs fois les mêmes intervalles de confiance dès qu’on fait plus 
de 51 simulations. 

La même simulation (figure 15) avec 100 intervalles de confiance simulés au seuil 0,95 obtenus à 
partir de 100 échantillons de 1000 individus extraits de la même population (la proportion inconnue 
est choisie aléatoirement à chaque série de 100 échantillons) fait apparaître une moindre fluctuation 
des bornes des intervalles. 


intervalles de confiance au niveau 95%, d'une proportion dans la population 
calculés à partir de 100 échantillons simulés, de taille 1000 


proportion de succès dans l'échantillon 


0 20 40 60 80 100 


100 simulations 


Figure 15 


e Simulation simple d’un échantillon avec p inconnue. 
Il s’agit de simuler des tirages d’échantillons dans une population où une proportion p est inconnue 
pour déterminer des intervalles de confiance de p au niveau de confiance 0,95. 
On cache donc la valeur de p (qui peut être choisie au hasard) qui permet de faire ces simulations et on 
fait afficher les intervalles de confiance trouvés. 


[FX Microsoft Excel - simulation sondage 


x 10 » 


fourchette candidat 0,18 0,25 


messe 
ss 


Document associé : simulation sondage.xls 


La cellule G1 contient alea() ou un nombre masqué choisi entre 0 et 1. 
Les cellules G3 et H3 contiennent les bornes inférieures et supérieures de l’intervalle de confiance. 
L’appui sur F9 relance la simulation avec une nouvelle valeur de p. 


e Simulation de plusieurs échantillons avec la même valeur de p inconnue. 


On peut simuler sur tableur pour une proportion inconnue fixée un grand nombre de calculs 
d’intervalles de confiance à un niveau de confiance que l’on peut choisir. 
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niveau de 
confiance — 


échantillon | fréquence 


fourchette 


49% 


41% 


[ 
[ 


[ 


39.20% 
31.36% 


31.36% 


58.80% 
50.64% 
54,75% 
50.64% 


] 
] 
] 
] 


[ 
( 
[ 


29.44% 
31.36% 
28.49% 


48.56% 
50.64% 
47.51% 


] 
] 
] 


[ 


[ 
[ 


31.36% 


34.27% 


35.25% 


50.64% 


53.73% 


54.75% 


] 


[ 
[ 
[ 


36.23% 
41.20% 
34.27% 


55,71% 
: 60.80% 
53.73% 


[ 


31.36% 


50.64% 


( 
[ 


33.30% 
36.23% 


52,70% 
55.77% 


[ 


40.20% 


59.80% 


[ 
( 
[ 


37,22% 
36.23% 
36.23% 


56.78% 
55.77% 


55.77% 


[ 
[ 


33.30% 
46.27% 


52,70% 
65.73% 


Document associé : intervalles de confiance simulés-peignes.ods ! 


Exemples d’exercices 


1. Diagnostic de la jaunisse 


0% 10% 


20% 


fréquence dans la 


population p = 


30% 


40% 


50% 


60% 


Un test de diagnostic rapide effectué sur des sujets ictériques (coloration jaune de la peau, des 
muqueuses -couche de cellules de protection recouvrant les organes creux en contact avec l’extérieur- 
et du blanc de l’œil -sclérotique-) doit permettre d’estimer si l’ictère est d’origine virale ou non, sans 
avoir besoin de faire des analyses longues et compliquées. Cependant il est important de pouvoir 
s’assurer que ce test est de bonne qualité c'est-à-dire qu’il doit pouvoir indiquer correctement si 
: il est positif 


l’ictère est viral ou non. Il doit être capable d’identifier correctement le type d’ictère 


chez les sujets dont l’ictère est viral et négatif sinon. 


Une étude est effectuée sur 100 personnes ayant un ictère viral et 100 personnes ayant un ictère 


d’origine non virale. 


Les résultats obtenus sont présentés dans le tableau ci-dessous 


| Hépatite virale Ictère d'origine non virale 


ET A EE ES 


5 Auteur du fichier : Stéphane Keller, LEGTA Louis Pasteur 
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d) 


Déterminer la proportion de sujets ayant un test positif parmi ceux ayant un ictère viral. 


Déterminer un intervalle de confiance à 95% de la proportion de tests positifs lorsque l’ictère est 
viral. Cette proportion est appelée sensibilité du test diagnostic, c'est-à-dire la probabilité qu’une 
personne ayant un ictère viral réagisse au test. Un test diagnostic sera d’autant meilleur que la 
sensibilité est importante. (réponse : [0,75 ; 0,951). 

Déterminer la proportion de sujets ayant un test négatif parmi celles ayant un ictère non viral. 
Déterminer un intervalle de confiance à 95% de la proportion de tests négatifs lorsque l’ictère est 
non viral. Cette proportion est appelée spécificité du test diagnostic, c'est-à-dire la probabilité 


qu’une personne ayant un ictère non viral ne réagisse pas au test. Un test diagnostic sera d’autant 
meilleur que la spécificité est importante.(réponse : [0,7 ; 0,91). 


2. Dépistage de la bronchiolite 


Dans le but d’évaluer la prise en charge de la bronchiolite du nourrisson dans un hôpital de la région 
Aquitaine, une étude rétrospective a été mise en place. 


1) Il est recommandé de coucher l’enfant de manière très inclinée (couchage en proclive) dans le 


2) 


cadre de la prise en charge de la bronchiolite. On évalue cette pratique à partir d’un échantillon de 
134 dossiers. 106 des enfants ont été couchés en proclive. 


Déterminer un intervalle de confiance au niveau de confiance de 95% de la proportion d’enfants 
dont le couchage respecte la recommandation. 


Solution 
106 1 106. 1 
134 ./134 134 134 


Une étude plus fine permet de comparer les pratiques entre les différents services ayant admis des 
enfants (cf. tableau 1). 

Tableau 1 : Répartition des cas suivant le type de services et le respect de la recommandation de 
couchage en proclive ; évaluation de la prise en charge de la bronchiolite en Aquitaine, une année 
donnée. 


[Horoioss 


Couchage En service des En service 
: ue Total 
proclive urgences hospitalier 
Oui 45 32 97 
Non 29 8 37 
Total 74 60 134 
a. Déterminer un intervalle de confiance au seuil de 95% de la proportion de couchage en proclive 
pour chaque type de service. 
Solution 
En service des urgences 
[45 1 45 1 
————; + |=|0,492 0,724] 
L74 4/74 74 74 
En service hospitalier 
[52 1 52 1 
+ | = [0,738 ;0,996|. 
L60 60 60 60 
b. (AP) Peut-on conclure selon vous au seuil de 95% que la pratique de couchage n’est pas 
identique selon le service ? 
Les deux intervalles de confiance n’ont pas d’intersection commune, on en conclut que les 
pratiques diffèrent entre les deux services. 
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Il s’agit là d’une règle assez répandue, même s’il en existe d’autres plus précises. 


3 Comparaison du taux de germination de semences de tomates de l'année avec celles de l'année 
précédente. 


Un maraîcher achète un lot de semences de tomates pour produire ses plants de tomate. Il lui reste 
des semences de l'année passée, dont il doit contrôler le taux de germination pour pouvoir les utiliser 
avec les autres. En effet, des taux de germination trop différents provoquent des trous dans les plates 
bandes de production, ce qui génère un coût de manutention plus élevé (il faut enlever les pots non 
germés avant de les conditionner). Il faut donc comparer les taux de germination des semences des 
deux années. 


Une stratégie (11 en existe d'autres, hors programme, mais qui peuvent faire l'objet d'une recherche) 
consiste à calculer et à comparer les intervalles de confiance des taux de germination (qui sont des 
proportions) des plants de l'année et de l'année précédente. Si les deux intervalles ne se recoupent pas, 
on peut conclure à une différence de taux de germination entre les semences des deux origines !®. Il 
faudra alors les semer séparément. 


Pour faire cette comparaison, le maraîcher prélève, aléatoirement dans les semences de l'année, un 
échantillon de 200 graines qu'il met à germer. Il constate que 185 graines germent. 


Il prélève ensuite, aléatoirement dans les semences de l'année précédente, un échantillon de 200 
graines qu'il met à germer. Il constate que 150 graines germent. 


1. Déterminer un intervalle de confiance, au niveau de confiance de 95%, du taux de germination p, 
du lot de semences de l'année. 
Solution 


ICos= [185/200 — 1//200 ; 185/200 + 1//200 ]< [0,925 — 0,071 ; 0,925 + 0,071 ] 
+[0,85;0,99] 


2. Déterminer (par la même méthode qu’à la question a)) un intervalle de confiance au niveau 95%, 
du taux de germination p, du lot de semences de l'année précédente. 


3. Conclure. 
Solution 


Les deux intervalles sont disjoints, on peut donc conclure à une différence entre les taux de 
germination p, et p, au niveau de confiance 0,95. 


Il est intéressant de noter que, sans connaître p, et p,, on dispose d'une méthode pour décider au 
niveau de confiance 95% que, si les intervalles de confiance sont disjoints, alors p, et p, sont 
différents. 

Il existe d’autres méthodes d’estimation, mais quelle que soit la méthode utilisée, si elle est issue 
d'un échantillonnage aléatoire, la décision sera toujours entachée d'un risque d'erreur. Les méthodes 
utilisées assurent seulement la maîtrise de certains risques de se tromper. 


16 L'étude de cette problématique est suggérée en AP. 
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VI. Compléments sur les lois uniforme et exponentielle 


A. Loi uniforme 
Le nouveau programme propose de définir la loi uniforme sur un intervalle [a,b] quelconque. 


Après avoir défini la loi uniforme sur [0.1] à partir, par exemple, du choix au hasard d’un réel entre 0 
et 1, on peut définir la loi uniforme sur [a,b] en remarquant que pour que l’aire sous la courbe soit 


égale à 1, il faut et il suffit que la valeur de la constante soit 
— a 


Une variable aléatoire X suit une loi uniforme sur l'intervalle [a,b] si sa densité est la fonction f 


définie sur [a,b] par : f@) = —. 
— a 


Espérance d’une variable aléatoire de loi uniforme sur [a,b] 


L’espérance d’une variable aléatoire X suivant une loi uniforme sur [a,b] est donnée par : 


b 
On peut observer que la définition de l’espérance par la formule E(X) = Î xf(x)dx prolonge celle de 


l’espérance d’une variable aléatoire discrète. 


En effet, le terme f (x)dx peut s’interpréter comme l’aire d’un rectangle de côtés dx et f (x), fournissant 
en quelque sorte la probabilité que la variable X prenne la valeur x. Dans ces conditions, 


b 
l'intégrale | xf(x)dx correspond à une « somme » de produits x x f (x)dx. 


La figure 1 ci-dessous présente la situation dans le casoùa=0etb=1. 


Figure 16 


Document associé : espérance d'une variable uniforme.ggb 


; , 1 k - . . 
On a représenté les rectangles de base — et de hauteur — , avec k entier variant de 1 à n. 
n n 
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= k1 ; : : ; : 
La somme S, =D des aires de ces rectangles peut s’interpréter comme l’espérance d’une variable 


rÈn 
discrète équirépartie prenant les n valeurs —, pour k variant de 1 à n. 
n 


(n+1) 


Elle vaut © ;— eta pour limite o 
2n 2 


Quand n tend vers l’infini, la somme des aires des rectangles tend vers l’aire située sous la droite 


| és ur (| Il 
d’équation y = x. On retrouve ainsi l’égalité Lx (x)dx = . 


Exemples d’exercices 


1. A partir de 7 heures le matin, les bus passent toutes les quinze minutes à un arrêt précis. Un usager 
se présente à cet arrêt entre 7h et 7h30. On fait l’hypothèse que l’heure exacte de son arrivée à cet 
arrêt, représentée par le nombre de minutes après 7h, est la variable aléatoire uniformément répartie 
sur l’intervalle [0, 30]. 


1) Quelle est la probabilité que l’usager attende moins de cinq minutes le prochain bus ? 
2) Quelle est la probabilité qu’il attende plus de dix minutes ? 


2. Partie A 
Olivier vient tous les matins entre 7h et 7h 45 chez Karine prendre un café. 


1) Sachant qu’Olivier ne vient jamais en dehors de la plage horaire indiquée et qu’il peut arriver 
à tout instant avec les mêmes chances, quelle densité peut-on attribuer à la variable aléatoire 
«heure d’arrivée d’Olivier » ? 

2) Calculer la probabilité qu’Olivier sonne chez Karine : 

e Après 7h30 e Avant 7h10 e Entre 7h20 et 7h22 e À 7h30 exactement. 


2. Partie B 
Olivier et Karine décident de se retrouver au café de l’Hôtel de Ville entre 7h et 8h. Les instants 
d’arrivée d'Olivier et Karine sont assimilés à des variables aléatoires de loi uniforme sur [0,1]. 


Chacun attend un quart d’heure mais jamais au-delà de 8h. Quelle est la probabilité qu’ils se 
rencontrent ? 


Éléments de solution 
Pour la partie B, si on note O la variable aléatoire « instant d’arrivée d’Olivier » et K celle de Karine. 


La probabilité cherchée est P(O — K | < 4 ; en utilisant une représentation graphique, cette probabilité 
est l’aire de la zone grisée ci-dessous, ensemble des points de coordonnées (x, y) du carré tels que 


x y <0,25. (On trouve z ). 
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B. Lois exponentielles 


Une variable aléatoire à densité X suit la loi exponentielle de paramètre 4 > 0 si sa densité est la 
fonction / définie sur [0,+00[ par : f(x) = 1e *. 


d 
Pour tout intervalle (c,d) 17, on obtient : P(X € (c,d)) =| 1e tee 6”, 


En particulier, on obtient P(X <a)=1-e *. 


L’espérance de X est la limite quand x tend vers + de [, tie * dt, on obtient E(X)= _. 


Pour effectuer le calcul de cette intégrale, on peut : 
> chercher une primitive de la fonction + Âte ‘sous la forme (at+b)e “et déterminer 
ensuite a et b 


> calculer la dérivée de la fonction g définie sur [0,+0[ par g(f) =-te ” et en utilisant le fait 


X 


que Ï ; g'(f)dt = g(x), obtenir la valeur de l’intégrale [tte “ar 
> Expliquer éventuellement sur cet exemple le principe de l’intégration par parties, bien qu’il ne 


soit plus dans les capacités exigibles du programme. 


On démontre qu’une variable aléatoire X suivant une loi exponentielle vérifie la propriété de durée de 
vie sans vieillissement, c'est-à-dire que, pour tous réels r et A positifs, P,.,(X >1+h)=P(X2>h). 


La réciproque de cette propriété n’est pas au programme. 


7 Cette notation désigne ici tous les types intervalles d’extrémités c et 4 où c<d. 
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Annexe 1 Introduction au théorème de Moivre-Laplace 


L’objet de cette annexe 1 est de situer le théorème de Moivre-Laplace dans une perspective historique. 
Celle-ci permet de montrer l’évolution de la pensée probabiliste depuis Jacques BERNOULLI jusqu’à 
Pierre-Simon de LAPLACE qui donnera la preuve complète de ce théorème avec la rigueur possible à 
son époque. 


La motivation commune à Bernoulli, Moivre et Laplace est de déterminer le plus finement possible la 
fluctuation"* des valeurs prises par une variable aléatoire suivant une loi binomiale autour de son 
espérance. Il s’agissait ensuite d’utiliser l'intervalle de fluctuation obtenu pour estimer une probabilité 
inconnue, ce qui est la problématique moderne de l'intervalle de confiance. 


Les énoncés des théorèmes sont donnés avec la formulation actuelle. 


A. La loi des grands nombres de Jacques Bernoulli 


Théorème de Bernoulli 


On considère une variable aléatoire X, suivant une loi binomiale G@ (4, p). On pose F, = —#. 
n 


Alors pour tout & > 0 on a : P(lFr,-p>e)< 20), 
nE 


Ce théorème est mvoqué pour justifier l’approche fréquentiste de la notion de probabilité. 


En effet, ce résultat liant fréquence et probabilité permet de donner une justification aux 
axiomes de la théorie générale (dite de Kolmogorov) par analogie avec les propriétés vues en 
statistiques. 


La démonstration originale de Bernoulli, donnée dans son ouvrage Ars conjectandi publié à Bâle en 
1713, fait appel avec beaucoup d’imgéniosité à la formule du binôme et aux propriétés des nombres 


n 3 r US: : 
h . Bernoulli est parfaitement conscient de la portée de son théorème comme le montre cet extrait de 


19 
son ouvrage : 


«Mais pour que cela ne soit pas compris autrement qu’il ne convient, il faut bien noter ce qui 
suit; je voudrais que le rapport entre les nombres de cas, que nous entreprenons de déterminer 
expérimentalement, ne fût pas pris de façon nette et sans partage (car ainsi c’est tout le contraire qui 
arriverait et il deviendrait d’autant moins probable de découvrir le vrai rapport qu’on ferait de plus 
nombreuses observations), mais je voudrais que le rapport fût admis avec une certaine latitude, c’est-à- 
dire compris entre une paire de limites, pouvant être prises aussi rapprochées qu’on voudra. » 


On voit que le concept d’intervalle de confiance déduit d’un intervalle de fluctuation est 
déjà présent dans l’œuvre de Bernoulli. 


Le théorème de Bernoulli est généralisé au dix-neuvième siècle par l’inégalité de Bienaymé- 
Tchebychev, après que les notions d’espérance et de variance auront été dégagées. 


Inégalité de Bienaymé-Tchebychev 


Soit (Q , P) un univers probabilisé et X une variable aléatoire définie sur Q possédant une 
variance V(X). On note E(X) son espérance. Alors pour tout £ > 0 on a : 


8 Les termes en italiques n’étaient pas utilisés par les mathématiciens de cette époque. 
1° Jacques Bernoulli , Ars Conjectandi, traduction de Robert Meunier, Irem de Rouen, 1987. 
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P(IX-E(X) 2 &)< es 
€ 


Cette inégalité est intéressante pour donner tout son sens à la notion de variance dans un cadre plus 
général que celui du théorème de Bernoulli. D’après cette inégalité il apparaît clairement que plus la 
variance est petite, plus les fluctuations de X autour de son espérance sont faibles. 


Remarque 
Fondamentale du point de vue théorique, cette inégalité est insuffisante du point de vue des 


applications numériques car l’information sur la probabilité que À, appartienne à l’intervalle de 


fluctuation [ PE, p+ el est peu précise. 


Exemple 
p=0,5 e=0,1 n=100 donnent un majorant de P(F, — p] > 0,1) égal à 0,25. 
1 1 
Or on sait que P|F,e|0,5-———;0,5+——— est voisin de 0,95 c'est-à-dire que 
| | V100 V100 ] 


P(F, _ pl Z 0,1) est voisin de 0,05. 


C’est la recherche d’une meilleure précision qui a motivé le travail de Moivre puis de Laplace. 


B. La démarche d'Abraham de Moivre 


Abraham de Moivre est un protestant français, qui s’est exilé en Angleterre après la révocation en 
1685 de l’Edit de Nantes. Il y rencontre James Stirling qui lui communique une précision importante 
sur la formule dite de Sfirling, en réalité déjà présente dans les travaux de Moivre. 


Dans son ouvrage The Doctrine of chances (1718), il met le calcul infinitésimal au service des 
probabilités. Cet ouvrage a été récemment traduit par les auteurs d’un document sur le théorème de 
Moivre-Laplace”!. 


: 1 : : 
Le but d’A. de Moivre est d’évaluer IE _ > SAS à + “ ï) où *, suit une loi 8 (n, 1/2). 


Il trouve 0,682688 comme valeur approchée en considérant n « infini ». 
Or la limite de cette probabilité existe et vaut 0,682689492 environ. 


De Moivre cherche ensuite à évaluer Ha \n<xX . + \n ] Il lui faut alors affiner sa technique 


+ 


et il utilise l’intégrale (au sens d’une aire) de la fonction x e *” apparue lors de l’évaluation de la 
1 1 
somme des probabilités P(X, =) quand = > SRS 26 ; 


Il parvient à la valeur approchée 0,95428 que l’on retrouvera plus loin. 


La méthode de Moivre est un peu difficile à suivre, mais elle est esquissée dans la partie C avec une 
rédaction moderne. 


En généralisant sans démonstration les résultats précédents au cas d’une loi 8(n, p), il donne les 
éléments pour déterminer la probabilité d’un intervalle de fluctuation. 


Il est intéressant de voir comment Moivre exploite son résultat. 
En l’utilisant dans le sens direct, il en déduit que les fluctuations dues au hasard sont très limitées : 


20 La loi des grands nombres, le théorème de De Moivre-Laplace, D.Lanier, D.Trotoux.. 
http:/www.math.ens.fr/culturemath/histoire/20des%20maths/pdf/LoidesGrandsNombres.pdf 
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«bien que le Hasard produise des Irrégularités, cependant les Rapports de Probabilités seront 
infiniment grands, et que avec l'avancement du Temps, ces Irrégularités n'auront aucune proportion 
avec le retour de l'Ordre qui résulte naturellement du DESSEIN ORIGINEL. » 

En sens inverse, il retrouve le concept d’intervalle de confiance déjà esquissé par Bernoulli : 
«inversement, si à partir d’Observations innombrables, nous trouvons que le Rapport des Evénements 
converge vers une quantité déterminée, comme le Rapport de P à Q ; alors nous concluons que ce 
Rapport exprime la Loi déterminée suivant laquelle l’Evénement se produit. » 

Et enfin comme souvent à cette époque, il déduit de ce résultat mathématique une conviction 
religieuse : 

«Et ainsi, si nous ne nous aveuglons pas nous-mêmes avec de la poussière métaphysique, nous seront 
conduits, d’une manière rapide et évidente, à la reconnaissance du grand CREATEUR et MAITRE de 
toutes choses ; Lui-même toute sagesse, toute puissance et bonté. » 


C. Une approche du résultat de Moivre 


On peut assez facilement comprendre comment apparaît la fameuse fonction dont la courbe a une 
forme de « cloche ». On a juste besoin de la formule dite « de Stirling ». 


Prenons le cas où p = . et donc P(X, =k)= HÔ , pour tout entier # compris entre 0 et n. 
Pan 
On pose Z, = Z et on cherche le comportement de P(Z, = 4 quand n est grand, x étant fixé. 


1 
—/n 
AL 
Il n 
On a: PP Ne dr À 


. Il fn a à 
Comme X, ne prend que des valeurs entières, k = 5. n + > doit être entier. 


On fixe x entier et on s’intéresse à la suite extraite de la suite (P (Z, : x)) correspondant aux entiers 7 
1 ; : : : 
de la forme n = (2m) .On a alors k = on +2m? = xm + 2m° qui est bien entier pour tout entier m. 


! 
6 D et quand m — +0 on a £ — +00 et n—k—>+00. 
k\(n—k)! 


n+— 
D’après la formule de Stirling, quand n est grand, n! est équivalent à n 2e "2x ce qui signifie que 


; n! —. 
le quotient de ——— à pour limite 1 lorsque n tend vers +oo. 
n+— 
n 2e "4/27 
n, k et n — k étant grands, on peut considérer que : 


1 
n+— 


il n 2 1 
P(Z, = x) - 
[27 xVn+n+1 =xV/n+n#1 2" 
2 
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2\:. XÙ 2 RES 2 . 
ox: fi-2)? . n-+ _—. fi) re 


d’où finalement l’équivalent suivant : 


valable pour x entier et 7 carré pair. 


Remarque 1 
Dans le cas de la suite extraite, on peut constater que PC _ à) tend vers 0 quand n tend vers l’infini. 
Il reste à justifier que le résultat est valable pour tout x et pour la suite complète. 


Remarque 2 


— : 2 : 
Deux valeurs consécutives de Z, sont distantes de —— donc sur un intervalle de cette longueur ne se 
x? 


Vn 
1 £ 


trouve qu’une valeur prise par Z,. Si on pose f He 2, l’équivalent trouvé peut s’écrire 
a 


f(x)Ax et donc s’interpréter géométriquement comme l’aire d’un « petit » rectangle de base Ax et de 
longueur f(x). Cela illustre la notion de densité. 


Remarque 3 
Numériquement pour ñn =100 et x=1,on obtient & =55. 


P(Z;00 = 1) 0,04847 et l'équivalent vaut environ 0,04839. 


Remarque 4 
L’aide apportée à Moivre par Stirling est la valeur de la constante égale à 427 dans l’équivalent de n !. 


D. Le théorème de Moivre-Laplace 


Pierre-Simon de Laplace a été le premier à écrire un ouvrage exposant l’état des connaissances dans le 
domaine des probabilités. Il s’agit de /a théorie analytique des probabilités”! (1812). Dans ce texte, 
Laplace expose d’abord une série de résultats d’analyse (fonctions génératrices, transformée de 
Laplace...) qui lui permettent de démontrer des résultats de probabilités, et en particulier le théorème 
de Moivre-Laplace. 


Laplace a des idées très précises sur les probabilités. Contrairement à Moivre, il ne cherche pas à 
prouver l’existence d’un Grand créateur, mais il cherche à approcher au mieux les lois qui régissent le 
monde dans lequel nous vivons. Il développe une vision très déterministe : 


*1 Texte intégral disponible à l’adresse 
http://books.google.fr/books?id=6MRLAAAAMAAJ&printsec=frontcover&dq=Th%E9orie+analytique+des+pr 
obabilit’E9s+Laplace#v=onepage&q&f-false 
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«Nous devons donc envisager l’état présent de l’univers comme l’effet de son état antérieur, et 
comme la cause de celui qui va suivre. Une intelligence qui pour un instant donné connaîtrait toutes 
les forces dont la nature est animée et la situation respective des êtres qui la composent, si d’ailleurs 
elle était assez vaste pour soumettre ses données à l’analyse , embrasserait dans la même formule les 
mouvements des plus grands corps de l’univers et ceux du plus léger atome : rien ne serait incertain 
pour elle, et l’avenir comme le passé, serait présent à ses yeux. » 


Ce n’est qu’au cours du vingtième siècle que cette vision déterministe sera remise en cause, en 
particulier par la physique quantique. 
Concernant le théorème de Bernoulli, voici ce qu’il écrit : 


« Ce théorème indiqué par le bon sens était difficile à démontrer par l’Analyse. Aussi l'illustre 
géomètre Jacques Bernoulli, qui s'en est occupé le premier, attachait-il une grande importance à la 
démonstration qu'il en a donnée. Le calcul des fonctions génératrices appliqué à cet objet, non 
seulement démontre avec fiabilité ce théorème, mais de plus il donne la probabilité que le rapport des 
événements observés ne s'écarte que dans certaines limites du vrai rapport de leurs possibilités 
respectives. » 


« Moivre a repris dans son ouvrage [The Doctrine of Chances] le théorème de Bernoulli sur la 
probabilité des résultats déterminés par un grand nombre d'observations. Il ne se contente pas de 
faire voir, comme Bernoulli, que le rapport des événements qui doivent arriver approche sans cesse de 
leurs possibilités respectives, il donne de plus une expression élégante et simple de la probabilité que 
la différence de ces deux rapports est contenues dans des limites données. » 


E. Convergence en loi 


Ce paragraphe peut être réservé à une seconde lecture, son contenu dépassant nettement le niveau de la 
classe terminale. 

Définition 

Soient une suite de variables aléatoires réelles (X,) et une variable aléatoire réelle X. 

On note F; (respectivement F; ) la fonction définie sur R par F;(x) = P(X< x) (respectivement 
Fx (x) =P(Y, < x) ) appelée fonction de répartition de X (respectivement de X,). 


La suite (X,) converge en loi vers X si, pour tout réel x où F> est continue, on a: 
lim F, (x)=F, (x). 


+00 


La convergence en loi n’est pas la convergence des nombres X,(w) vers X(œ) mais la 
«convergence » des lois, et plus précisément la convergence simple, aux points de continuité de Fx, de 
la suite de fonctions F PACS la fonction F,. L'expression « la suite (X,)» converge est donc un 


abus de langage, mais il est universellement pratiqué. En fait, si la suite ( X, ) converge en loi vers X, 
alors elle converge en loi vers n’importe quelle variable aléatoire ayant la même loi que X. 


Cas particulier 
Dans le cas où toutes les variables sont à valeurs dans IN, la convergence en loi s’exprime par : 
VkEN, lim P(X,=4)=P(X =). 


n—+00 
Exemple 
On considère une suite de variables aléatoires ( Ÿ, ) suivant une loi binomiale B (n, 1/n). 


k n—k 
On démontre que : VX EIN, lim P(X, =#4)= lim A É 1) 87 _ 


n—+00 n—+00 n 
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La loi limite est appelée loi de Poisson” de paramètre 1. 

Comme pour la loi normale centrée réduite, cette loi est apparue comme loi limite. 

Elle a ensuite été utilisée comme modèle dans divers domaines ; elle est appelée également loi des 
événements rares. 


Annexe 2 Compléments sur les lois normales 


A. Loi normale centrée réduite 


Théorème 


L’aire située entre la courbe représentative de la fonction f sur IR définie 
1? 


e 2? et l’axe des abscisses est égale à 1. 


par f (0) = = 


On dit qu’une variable aléatoire X suit une loi normale centrée réduite W(0,1) si sa densité est la 
2 
fonction f()}=——e ?. 


\2x 


On note ® sa fonction de répartition c'est-à-dire la fonction définie sur KR par : 
P P 


D(x) = P(X < x) = Î : fOdr 


Représentations graphiques : 


Figure 1 : f(t) = 


e 2 Figure 2 : D(x)= P(X < x)= [ ft 

—00 
Remarque : Il faut noter que la fonction f n’a pas de primitive « explicite », c’est à dire qu’il est 
impossible de l’exprimer algébriquement avec les fonctions usuelles (polynômes, exponentielle, 


logarithme...). Pour cette raison, il a été établi des tables numériques (comme les tables de 
logarithmes). Avec les calculatrices, ces tables ont aujourd’hui perdu leur intérêt. 


Quelques propriétés 
P1. D(—-x)=1-D(x). 


Visible graphiquement sur la figure 4 on peut aussi démontrer cette formule par changement de 
variable. 


7? Siméon-Denis Poisson (1781-1840) Recherches sur la probabilité des jugements en matière criminelle et en 
matière civile 
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On en déduit que (0) = P(X < 0) = P(X > 0) = . ; 

Une variable suivant la loi (0,1) a donc 0 pour médiane. 

P2. D'= f. 

Il suffit d’écrire P(x) = [_. Fe dr+[ f (t)dt = {6 f(t)df pour constater que ® est de classe 


C' sur R et que sa dérivée est f. 
P3. ® est une bijection strictement croissante de IR dans ]0,1[. 
La stricte croissance et la continuité sont immédiates. 


Les limites aux bornes sont 0 et 1° et elles ne sont pas atteintes du fait que ® est strictement 
croissante. 


B. Lois normales 


Une variable aléatoire X suit une loi W(u, o ?) si <— # suit la loi normale W (0,1). 


Propriété de stabilité par addition et multiplication par un réel 
Cette propriété est bien sûr hors programme en terminale puisque la somme de variables aléatoires n’y 
est pas abordée, ni la notion de variables indépendantes. Elle est cependant d’une très grande 
importance et justifie en particulier la notation W(u, o ?). 
Propriété 
Si X suit une loi (ab?) et que Y suit une loi W(c,®) et qu’elles sont indépendantes, alors 
leur somme X + Y suit également une loi normale de paramètres a + c et b?+ d°. 


C’est cette propriété qui justifie la notation W(u, o *), à savoir que les variances s’additionnent (si les 
variables sont indépendantes) mais pas les écarts types. 


Annexe 3 Approche simplifiée de la théorie des sondages 


Dans la plupart des situations il est impossible d’interroger ou de recueillir des informations sur 
l’ensemble de la population ; pour cette raison on se contente le plus souvent d’un échantillon. Un 
échantillon correspond à un sous-ensemble de la population qui intéresse le responsable de l’étude. 
Pour que les informations recueillies auprès de l’échantillon puissent permettre d’estimer des 
caractéristiques de la population il est important d’être rigoureux et d’utiliser des méthodes 
d’échantillonnage appropriées. Ces différentes méthodes sont présentées succinctement ci-dessous. 


A. Qualités d’un échantillon permettant de répondre à une question posée 


L'observation d’un échantillon ne permet pas de décrire avec certitude une population mais seulement 
d’estimer par intervalles de confiance les valeurs de certaines caractéristiques que l’on souhaite 
connaître dans cette population. 


7 En utilisant la définition d’une intégrale généralisée convergente. 
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« Voir invoquer la « représentativité » dans un rapport d'enquête pour justifier de la qualité d’un 
sondage peut presque à coup sûr laisser soupçonner que l'étude a été réalisée dans une 
méconnaissance totale de la théorie de l’échantillonnage. Le concept de représentativité est 
aujourd'hui à ce point galvaudé qu'il est désormais porteur de nombreuses ambivalences. Cette 
notion, d'ordre essentiellement intuitif, est non seulement sommaire mais encore fausse et, à bien des 
égards, invalidée par la théorie … »°* 


La première chose à préciser c’est qu’avec un échantillon on ne peut pas être représentatif de 
l’ensemble de la population sur toutes les caractéristiques, il est donc important de définir les 
caractéristiques qui intéressent les responsables de l’enquête. 


Pour un statisticien, l’échantillon sera dit représentatif si on peut correctement estimer les paramètres 
d'intérêt de la population à partir de l’échantillon. Dans le cas contraire on parlera de biais 
d’échantillonnage. Pour pouvoir correctement estimer les paramètres, le statisticien n’a pas 
nécessairement besoin que l’échantillon soit une reproduction miniature de la population, par contre il 
a besoin que tous les profils de la population importants pour l’objectif de l’enquête soient représentés 
dans l’échantillon. Cela signifie donc que le plan d’échantillonnage utilisé dépendra de l’objectif de 


l’étude même si la population est la même. 


La représentativité d’un échantillon nécessite que la procédure d’échantillonnage permette la 
constitution d’un sous-groupe recouvrant les caractéristiques qui peuvent influencer la valeur des 
paramètres que l’on veut estimer. La non-représentativité d’un échantillon peut par exemple être due à 
la sélection dans une base de sondage ne couvrant pas correctement la population. 


Par exemple, supposons qu’on souhaite réaliser une enquête de prévalence d’une maladie A dans la 
population générale et qu’on sélectionne un échantillon à partir de la liste téléphonique (l’enquête 
devant se dérouler par appel téléphonique). Dans ce cas l’échantillon ne couvre pas correctement la 
population il y a un biais d’échantillonnage car les personnes qui répondront à l’enquête auront un 
téléphone et seront présentes à leur domicile, pour cette raison toutes les personnes qui seront 
hospitalisées à la date de l’enquête ne seront pas interrogées. Si les personnes atteintes de la maladie 
étudiée sont plus susceptibles de se rendre à l’hôpital, on risque de sous-estimer la prévalence de la 
maladie ou proportion de malades, en réalisant un échantillon comme proposé ci-dessus. 


Dans tous les cas de figures on souhaite enquêter sur un nombre suffisant de sujets afin de pouvoir 
estimer correctement le paramètre de la population. 


En principe la taille de l’échantillon est indépendante de la taille de la population que l’on veut étudier. 
Il faut interroger autant de personnes pour estimer avec la même précision le résultat de l’élection 
présidentielle en France, que l’élection du maire de Bordeaux. 


La taille est en revanche fonction de la marge d’erreur (amplitude de l’intervalle de confiance) que 
l’on accepte de prendre et qui résulte inéluctablement du fait que l’estimation est issue d’un 
échantillon. 


Un sondage peut être effectué de multiples façons que l’on regroupe en deux grandes familles : les 
sondages aléatoires, dits aussi probabilistes, et les sondages non aléatoires, dits aussi empiriques ou 
informels. 


B. Echantillonnage non-probabiliste ou non aléatoire 


Pour ce type de sondage la sélection des individus n’obéit plus au hasard mais est définie selon 
des critères de faisabilité, de ressemblance à la population et de critères subjectifs dépendant du choix 
des enquêteurs. 


Les types de sondage satisfaisant aux critères de faisabilité ou de simplicité sont par exemple les 
échantillons de sujets volontaires (par exemple les enquêtes publiques préalables à la déclaration 


# y. Tillé (2001), Théorie des sondages : Échantillonnage et estimation en populations finies : cours et exercices, 284 pages, Paris, 
Dunod 


Ministère de l’éducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 52 sur 70 
Mathématiques - Probabilités et statistique 


http://eduscol.education.fr/proq 


d'utilité publique : les personnes qui le souhaitent prennent connaissance du projet et consignent leurs 
observations sur un registre d'enquête ouvert en mairie) ou les échantillons de convenance (par 
exemple on effectuera une enquête auprès de toutes les personnes qui viennent à la poste centrale de la 
ville V le mardi 4 septembre 2012). 


Les types de sondage satisfaisant aux critères de ressemblance à la population sont appelés 
échantillonnage par choix raisonné. La méthode des quotas, qui est la méthode la plus utilisée parmi 
les sondages non aléatoires et dans les sondages d’opinion, fait partie de cette catégorie de sondage. 
Les enquêteurs doivent inclure un nombre donné d'individus présentant telle ou telle caractéristique 
dans des proportions voisines de celles de la population. Du moment que le quota est respecté, le mode 
de sélection des individus est laissé au libre choix de l'enquêteur. La méthode des quotas consiste à 
construire un échantillon qui soit une maquette, un modèle réduit de la population étudiée, en 
conservant les mêmes proportions. La plupart des sondages politiques effectués en France utilisent 
cette méthode. 


La date cruciale pour l’histoire de l’échantillonnage est le mardi 3 novembre 1936, jour de la 
publication des résultats de l’élection présidentielle aux États-Unis. Le journal « Literary Digest » 
avait réalisé des sondages pré-électoraux, comme à leur habitude, par consultation individuelle 
d’électeurs (appelés « votes de paille » à cette époque). Cette méthode ne fait appel à aucune notion de 
représentativité, mais est réalisée sur un nombre important d’électeurs et jusqu’en 1936 elle donne des 
résultats tout à fait satisfaisants. Ce journal comme bien d’autres prédit alors l’élection de Lanton, 
mais finalement F.D. Roosevelt est élu. Seuls trois sondages l’avaient donné gagnant, tous réalisés par 
une méthode empirique appelée la méthode des quotas. Ce fut le début des grandes structures de 
sondages telles que la société de sondage Gallup aux Etats-Unis. 


C. Echantillonnage probabiliste 


Dans un plan d’échantillonnage aléatoire, tous les individus de la population ont une probabilité 
connue et non nulle d'être sélectionnés pour faire partie de l’échantillon. La sélection des individus 
constituant l’échantillon s’effectue par un plan d’échantillonnage à un ou plusieurs degrés et à chaque 
degré une procédure de tirage au sort est spécifiée ; il peut s’agir d’une procédure de sondage aléatoire 
simple, ou systématique, ou d’une procédure stratifiée, avec sélection équiprobable ou à probabilité 
proportionnelle à la taille. Logiquement seuls les sondages aléatoires permettent de fournir des 
estimations avec une précision donnée, c’est- à -dire avec un intervalle de confiance. 


Les sélections aléatoires à partir d’une liste d’individus peuvent s’effectuer de différentes façons. 
Prenons l’exemple d’une enquête que l’inspection académique souhaiterait réaliser auprès des élèves 
des lycées d’un département afin d’étudier les difficultés scolaires rencontrées par ceux-ci. Il est 
impossible d’interroger la totalité des élèves et le souhait est de pouvoir obtenir des informations sur 
un échantillon représentatif de 500 élèves. Pour cette dernière raison il est décidé de sélectionner 
aléatoirement les élèves, mais plusieurs méthodes peuvent être proposées. 


1) si la liste de tous les élèves est accessible de manière électronique on peut sélectionner 500 
élèves dans la liste en utilisant par exemple un tableur, il y a plusieurs méthodes pour cela : 

a. créer pour chaque élève un nombre aléatoire suivant une loi uniforme, puis choisir de 
trier la liste en fonction de ce nombre aléatoire créé, cela revient à mélanger de façon 
aléatoire la liste. On sélectionne finalement les 500 premiers noms qui sont dans la 
liste triée. Cette méthode permet de réaliser une sélection simple sans remise. 

b. Numéroter tous les élèves de la liste, puis utiliser la fonction aléatoire du tableur pour 
sélectionner uniquement 500 nombres, les élèves correspondant à ces nombres seront 
sélectionnés. En appliquant cette méthode un nombre peut être sélectionné plusieurs 
fois. Cela revient donc à réaliser un échantillon avec remise. 

c. On peut aussi utiliser la méthode de sélection systématique, c'est-à-dire que si le 
nombre d’élèves est égale à N on tire au sort un nombre, noté d, entre 1 et N puis on 
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sélectionne de manière régulière sur la liste le d +——énième élèves, si ce nombre 


dépasse le rang du dernier élève on reprend la liste au début. 


Les trois méthodes présentées ci-dessus sont des sélections que l’on peut considérer équiprobables car 
chaque sujet a la même probabilité d’être sélectionné. 


2) On peut souhaiter effectuer une enquête en face à face, c'est-à-dire qu’un enquêteur doit se 
déplacer pour interroger l’élève, il est donc important d’essayer de gérer le nombre de 
déplacements. Dans les méthodes proposées précédemment rien n’est contrôlé et l’enquêteur 
peut devoir traverser le département pour interroger un et un seul élève. Afin d’améliorer cela 
on peut décider de sélectionner un certain nombre d’établissements et de sélectionner un 
certain nombre d’élèves dans chaque établissement. On parlera alors de sondage à plusieurs 
degrés. Dans ce cas la sélection n’est pas toujours équiprobable. 


Exemple : supposons que 10 des 70 lycées soient sélectionnés et dans chaque lycée 
sélectionné on sélectionne 30 élèves. Dans ce cas la probabilité que l’élève A soit 
sélectionné est environ égale à 10/70 * 30/(nb d’élèves du lycée d’appartenance de l’élève 
A) , on remarque que cette probabilité dépend de la taille du lycée et donc non 
équiprobable. 


3) On peut vouloir construire un échantillon représentant les lycées généraux et professionnels. 
Dans ce cas et afin de forcer cette représentativité, on commence par partager en deux paquets 
la liste : liste des lycées professionnels et liste des lycées généraux et on effectue un 
échantillon dans chacune des deux listes. On parle alors de sondage stratifié. 


Annexe 4 Utilisation des Tice 


A. Tableau des fichiers du document ressource Probabilités et Statistique du programme de 
Terminale. 


Les textes en italique ou en italique vert concernent des fichiers non référencés de certaines figures du 
document principal ou des fichiers d'activités complémentaires n'apparaissant pas dans le document 
principal. 


DOCU- FICHIERS FONCTIONS, PARAMÈTRES D'ANIMATION OU DE FONCTION ET 
MENTS DESCRIPTION 
DE n (10 ; 60 ; 1 ; curs) signifie que l'on peut faire varier le paramètre n de 10 
SYNTHÈS à 60 avec des pas de 1, à l'aide d'un curseur. curs peut être remplacé par 
E bouton (à cliquer). 

Annexe 4 InitiationR1.r | Démarrage rapide en R : installation et quelques exemples commentés, 

bibliographie. 

VI Figure espérance d'une | Animation GeoGebra illustrant l'aire de n (0 ; 40 ; curs) rectangles de base 

16 variable 1/n, de hauteur k/n avec 1 <k <£ n. Convergence de la somme de l'aire de tous 
uniforme.ggb les rectangles vers l'aire sous la droite y = x. 

I Figure 1 | Centrer et Animation GeoGebra: superposition des diagrammes en barre de X v.a. 
réduire une binomiale de paramètres n (10 ; 60 ; 1 ; curs) et p (0 ; 1 ; 0,01 ; curs), de X — 
binomiale.gob nxp, variable centrée et de Z = (X — nxp) / racine(n x p * (1 —-p)), variable 

centrée et réduite. 

I Figure 2 | diagramme en Animation GeoGebra : diagramme en bâton de la variable fréquence 
bâtons de Fn.ggb | Fn=(Xn-p)/ V(p*(1 — p) /n), pour n (10 ; 60 ; 1 ; curs) et 

p (0 ; 1 ; 0.01 ; curs). 
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SYNTHÈS 
E 


FICHIERS 


FONCTIONS, PARAMÈTRES D'ANIMATION OÙ DE FONCTION ET 
DESCRIPTION 
n (10 ; 60 ; 1 ; curs) signifie que l'on peut faire varier le paramètre n de 10 
à 60 avec des pas de 1, à l'aide d'un curseur. curs peut être remplacé par 
bouton (à cliquer). 


II Figure 3 


binomiale et 
normale.cob 


Animation GeoGebra: illustration du théorème de Moivre-Laplace : 
convergence de la suite de variables centrées réduites Zn, avec n 

(10 ; 300 ; 1 ; curs) et p (0 ; 1 ; 0,01 ; curs) vers la loi normale centrée 
réduite. 


III Figure 
7 


visualisation 
probas 
normales.ggb 


Animation GeoGebra : illustration des calculs de probabilité (calcul intégral 
d'aires) P(a < x < b), avec les lois normales de moyenne m (0 ; 5 ; 0,1 ; curs) 
et d'écart type © (0 ; 5 ; 0,1 ; curs), avec a (-5 ; 5 ; 0,1 ; curs) et b (- 

5; 5; 0,1 ; curs). 

On peut donc faire la représentation graphique de la fonction de densité de la 
loi normale centrée réduite. 

Et visualiser les probabilités des intervalles mu + sigma (m 
(m + 20), mu + 3sigma (m + 30). 


o), mu + 2sigma 


II Figure 
6 


TaillesHommes.r 


tailleshommes(n = 50000, mu = 175, sigma = 8) 

Fonction en R : Simulation d'un échantillon (une série statistique) de n 

(50 000) tailles d'hommes tirés d'une distribution normale de moyenne mu et 
d'écart type sigma. L'histogramme est tracé, quelques paramètres de la série 
sont calculés. On obtient d'autres séries que celle illustrée dans le document. n, 
mu et sigma sont des paramètres que l'on peut changer à volonté. 


III Figure 
8 


influence de mu 
et sigma.ggb 


Animation GeoGebra : Influence de la moyenne et de l'écart type sur la forme 
de la courbe représentative de la densité de la loi normale de moyenne 
m (0 ; 7; 0,1 ; curs) et d'écart type © (0,3 ; 3 ; 0,1 ; curs). 


IV-B 


intervalle de 
fluctuation 
première.alg 


Algorithme-programme Alsobox de calcul des deux bornes de l'intervalle de 
fluctuation binomial exact, selon une méthode du document ressource de lère. 

: Queues symétriques (équilibrées) en probabilité 

n est la taille de l'échantillon, p est la probabilité de succès, a et b sont les deux 
bornes de l'IF. 

Attention : limité à n<70 


IVB 


intervalle de 
fluctuation 
première.r 


IFexact2(n = 65, p = .06, kobs = 8, proba = .95) 

Fonction en R : IF binomial exact, selon une méthode du document ressource 

de 1ère : Queues symétriques (équilibrées) en probabilité 

n est la taille de l'échantillon, p est la probabilité de succès, kobs est le nombre 
de succès observé dans l'échantillon 

proba est le seuil de l'intervalle de fluctuation. 

a est le plus petit entier tel que P(X <= a) > 0,025 ; b est le plus petit entier tel 

que P(X <= b) >= 0,975 

Une conclusion est proposée quant à l'hypothèse testée. 


IV-B 


AutresAlgo 
DuDoc.pdf 


IF _BinomialExa 
ctlr 


IFexactl(n = 65, p =.06, kobs = 8, proba =.95) 

Fonction en R : IF binomial exact, selon une méthode du document ressource 
de lère : Queues symétriques (équilibrées) en probabilité 

n est la taille de l'échantillon, p est la probabilité de succès, kobs est le nombre 
de succès observé dans l'échantillon 

proba est le seuil de confiance de l'intervalle de fluctuation. 

a est le plus grand entier tel que P(X < a) < 0,025 ; b est le plus petit entier tel 
que P(X > b) < 0,025 

Une conclusion est proposée quant à l'hypothèse testée. 


IV C 


exploration de 
l'intervalle de 
fluctuation 
asymptotique.r 


piFasy2_1(n = 400, p=.5, proba = .95) 

Fonction en R : illustration de l'évolution de la probabilité binomiale de 
l'intervalle de fluctuation asymptotique IF2 : (p +u,,4*racine(p*X(1 — p) / n)) 
en fonction de n et p. 

n est la taille de l'échantillon, p est la probabilité de succès, proba est la valeur 
seuil de la probabilité de l'IF. 
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DOCU- FICHIERS FONCTIONS, PARAMÈTRES D'ANIMATION OÙ DE FONCTION ET 
MENTS DESCRIPTION 
DE n (10 ; 60 ; 1 ; curs) signifie que l'on peut faire varier le paramètre n de 10 

SYNTHÈS à 60 avec des pas de 1, à l'aide d'un curseur. curs peut être remplacé par 

E bouton (à cliquer). 

IVC exploration Feuille de calcul tableur permettant une visualisation des probabilités des 
Figure 9 intervalle de intervalles de fluctuation asymptotiques de seconde et de terminale. 
fluctuation p est la probabilité de succès. Pour celui de seconde, on peut conjecturer 
asymptotique.od | l’existence du seuil n, du paragraphe V-C-7. 
s 
IV C intervalle de plFasy1_1(n = 700, p =.5, proba = .95) 
Figure 11 fluctuation Fonction en R : illustration de l'évolution de la probabilité binomiale de 
seconde.r l'intervalle de fluctuation asymptotique IF1 : (p + 1 / racine(n)) en fonction de 
netp. 
n est la taille de l'échantillon, p est la probabilité de succès, proba est la valeur 
seuil de la probabilité de l'IF. 
IVE recherche du Algorithme-programme Algobox de recherche, pour un p donné, de la plus 
n0.alg petite valeur n0 de n telle que la probabilité exacte que X appartienne à l'IF1 
(p + 1 / racine(n)) soit au moins égale à 0,95. Valeurs de n au plus égales à 70, 
application numérique restreinte. 
IVE recherche du Programme Scilab de recherche, pour un p donné, la plus petite valeur n0 de 
n0.sce n telle que la probabilité exacte que X appartienne à l'IF1 (p + 1/racine(n)) 
soit au moins égale à 0,95. 

AutresAlgo nlFasy1_L.r nlFasy1_1(nsup = 1000, probinf = .95) 

DuDoc.pdf Fonction en R : Pour les valeurs de p de 0,05 à 0,95, de 0,01 en 0,01, 
recherche la plus petite valeur n0 de n telle que la probabilité exacte que X 
appartienne à l'IFI (p  1/racine(n)) soit au moins égale à probinf. Tableau 
des valeurs de n0 et graphique de n0 en fonction de p. 

V intervalles de simlCdoc(n = 50, nbsim = 100, nbclass = 20) 

Figures 14 confiance Fonction en R : Simulations d'un peigne d'IC au niveau de confiance nominal 

et 15 simulés.r de 0,95. nbclass est le nombre de classes de l'histogramme. La proportion de p 

dans la population est générée aléatoirement dans ]0 ; 1[. Elle est affichée dans 
la console R. 

SimullCPropSim | simlC(n = 50, nbsim = 100, nbclass = 20, moustache = 1.5) 

plr Fonction de R : Simulation d'un peigne d'IC. nbclass est le nombre de classes 
de l'histogramme, moustache détermine la longueur des moustaches des boites. 
La proportion de p dans la population est générée aléatoirement dans ]0 ; 11. 
Le peigne est suivi de l'histogramme et de la boite à moustache de la 
distribution simulée. 

V simulation Simulation tableur d'un intervalle de confiance d'une proportion p inconnue, 
sondage.xls calculé à partir d'un échantillon de taille 1000. F9 pour refaire une autre 

simulation. On peut dévoiler p en mettant une couleur de police visible. 

V intervalles de Simulation tableur d'un peigne de 100 intervalles de confiance gaussiens 
confiance d'une proportion p (0% ; 100% ; 1% ; boutons) au niveau de confiance c 
simulés- (0% ; 100% ; 1% ; boutons). Pour chacun des 100 échantillons simulés, la 
peignes.ods feuille affiche f observé, l'intervalle de confiance (fourchette), VRAI si l'IC 

contient p, FAUX sinon, le pourcentage d'IC contenant p, et la représentation 
graphique de l'IC, en barre horizontale. On peut cacher ou faire afficher p. F9 
pour lancer une nouvelle simulation de 100 échantillon de taille n = 100. 
VIC monte carlo.alg Calcul approché par la méthode du « rejet » de l'intégrale de 0 à 1 de FI(x) (à 
Figure 17 saisir). Le nombre n de tirages est saisi en entrée. 
Graphique indiquant la surface atteinte par les tirages. 
VIC monte Carlo Calcul approché par la méthode de l'espérance de l'intégrale de 0 à I de 


bis.alg FI(x). Le nombre n de tirages est saisi en entrée. 
commandes R.pdf Liste de commandes R. 
Carte de Fonctions vitales, outils de programmation sous R. 
référence R.pdf 
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B. Prise en main rapide du logiciel R 


QUELQUES EXEMPLES COMMENTÉS POUR DÉMARRER AVEC R 
PROBABILITÉS, SIMULATIONS ET EXPLORATION DES SÉRIES SIMULÉES 


I - INSTALLATION - MISE EN ROUTE 
1° Installation 
e R est un logiciel libre et gratuit téléchargeable à http://cran.univ-lyonl.fr, (site miroir) le site 


parent étant www.r-project.org. Il est multiplateforme, c'est à dire qu'il existe des versions qui 
tournent sous linux, mac et windows. 


e Il existe quelques ouvrages et un grand nombre de sites en français, d'IUT, d'universités, 
d'organismes de recherche et d'écoles d'ingénieurs, traitant de l'utilisation de R (voir bibliographie). 


e L'installation se fait très rapidement et simplement à partir du fichier exécutable téléchargé. Ce 
"package" de base est complet et permet d'effectuer tous les traitements statistiques courants 
(description, analyse exploratoire des données, probabilités, simulation, tests statistiques). 


e L'utilisation de R peut se faire en ligne de commande, l'installation de base y suffit. On peut aussi 
utiliser certaines fonctionnalités de R sous forme classique de menus cliquables en français, il faut 
alors installer le package "Remdr"'. Les commandes R correspondant à chaque menu sont affichées, 
ce qui facilite une première prise en main. La rédaction et la lecture des lignes de commande R sont 
grandement facilitées par l'utilisation d'un éditeur spécifique, "Tinn-R"' (téléchargeable à 
http://sourceforge.net/projects/tinn-r) qui identifie toutes les commandes R et leurs paramètres et 


les colorie de façon différenciée pour en faciliter l'identification et l'utilisation. 


e Dans les fichiers mis à disposition, figurent deux "Reference card" ("Rrefcard2.pdf"' et 
"ShortRefCard.pdf'"') qui contiennent les principales commandes R classées par thème. 


e La communauté des utilisateurs de R développent, pour les besoins des structures dans lesquelles 
ils travaillent ou des recherches engagées, des "packages" "agréés" par une "R-core-team", qu'ils 
mettent à disposition sur les sites et qui peuvent s'installer automatiquement. Il en existe plusieurs 
centaines. Deux sont mentionnés dans certains fichiers annexés au document ressource, qui sont 
"“attice" (graphismes avancés) et "Hmisc" (présentation avancée de résumés numériques). De même 
il existe un package (et un ouvrage en français) dédiés à l'analyse des données à la française, 
"FactoMineR", développé par trois enseignants chercheurs de l'AgroCampus de Rennes. 

2° Utilisation de l'interface avec menus à cliquer en français : "Remdr" 

e On peut utiliser R en mode menus à cliquer en français. Le code de chaque commande sollicitée 
par les menus apparaît dans la "Fenêtre de script" est exécutée dans la "Fenêtre de sortie", qui affiche 
aussi les résultats. Cet affichage des commandes correspondant aux menus cliqués permet 
l'apprentissage progressif des codes des commandes R. C'est aussi un bon outil pour imitier les élèves. 

Il faut pour cela installer le package Remdr : Après avoir lancé R (RGui) et être connecté à 
internet, c'est automatique via le menu "Package — Installer le package"). Pour l'exécuter il faut cliquer 
le menu Package — Charger le package" ou taper require(Remdr) dans la console R. 

Voici un exemple simple de simulation d'une série de nombres tirés d'une loi normale centrée 
réduite, que l'on décrit ensuite par un tiges et feuille et un histogramme. 
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R JE 


tequire (Mere) 
He Chargement et exécution de Remdr 


nécessité 


Acvechenent Qu package : ‘Rendr 
The following objet (+) axe masked £com ‘pechegr:teitk | 
teen 


Fitéer Edton Données Siéwtques Graves Modèles Dotrémtiens Out Aide 


R, certes: cons seine RC RO EE TT ES | 


Fenêtre de sorpt 


FRRRE nus | L'interface des menus à cliquer en français est 


lancée. 


T1] NOTE: F Coamandér Version 1.6-4: Sun Sep 25 19:01:46 2011 


Utilisation directe : simulation de 100 nombres distribués selon la loi normale centré réduite et on 
fait afficher les 10 premières valeurs de la série simulée "EchantillonsNormaux". 


COMMENTE 
Fichier Edition Données Statistiques Graphes Modèles 
Distribution: 


ea A] 
Ra JE] Distributions discrètes + 


Fenêtre de script PR PERF 3 a | 


Distributions 


ntinues + Distribution normale 
Distribution & 
Distribution Chi-deux... 


Distribution F 


Quantiles normaux... 
Probabilités normales... 
Graphe de la distribution normale. 


Echantillon d'une distribution Normale... 


Distribution exponentielle 
Distribution uniforme 


Distribution Cauchy 
Distribution logistique 
Distribution Log-Normale 


Distribution Gamma 
Distribution de ‘#eibull 
Distribution Gumbel 


> 
> 
> 
> 
» 
» 
Distribution Beta > 
» 
> 
» 
» 
» 
» 


a 


Fichier Edition Données Statistiques Graphes Modèles 


Distributions Outils Aide 


R,, vomées :| Echanlonsnomaux | [ Ester ]{ visualiser ] modèle: |<pas de modèle> 


SeampletromiNonmel Distnbu tom (= EX) 


Fenêtre de script Nom du tableau de données : [EchantilonsNormaux 
[EchantillonsNormaux <- as.data.frame (matrix (rnorm(100*1, mean=0, sd=1), ncol=1)} Moyenne 
(rounames (EchantillonsNormaux) <- paste("sample", 1:100, sep="") Ecart type 


(colnames (EchantillonsNormaux) <- "obs" 


EchantillonsNormaux(1:10,] MEN ALT) 


Nombre d'observations (colonnes) 


Ajouter au jeu de données : 

Moyennes des échantilons  [ 
Somme des échantilons [7 
Ecart types des échantillons 


Fenêtre de sortie 


{> EchantillonsNormaux <- as.data.frame (matrix (rnorm(100*1, mean=0, sd=1), ncol=1)) 
> rownames (EchantillonsNormaux) <- paste{"sample", 1:100, sep=""} 


> colnanes (FchantilionsNommeux) <- "obs” 


{> EchantillonsNormaux[1:10,] 
[1] 0.96909153 1.15096488 -0.06963525 -0.70692093 -0.53246341 0.76325761 -0.46421104 0.86899574 0.61856879 -0.96713430 


Messages 
[14] NOTE: Le jeu de données EchantillonsNormaux a 100 lignes et 1 colonnes. 


Ministère de l’éducation nationale, de la jeunesse et de la vie associative (DGESCO) Page 58 sur 70 
Mathématiques - Probabilités et statistique 


http://eduscol.education.fr/proq 


Description de la série simulée, diagrammes en tiges et feuilles et histogramme : 


7% LE g 


Distributions Outils Aide 


a Données :| EchantilonsNormaux | Modèle : | <Pas de modèle > 


Fenêtre de script 
EchantillonsNormaux <- as.data.frame (matrix (rnorm(100f1, mean=0, sd=1), ncol=1)) [A] | 


rounames (EchantillonsNormaux) <- paste("sample", 1:100, sep="") D SR mené. a | CV) 
colnames (EchantillonsNormaux) <- "obs" Graphemeesetenlles EE) 
EchantillonsNormaux[1:10,] 


Fichier Edition Données Statistiques Graphes Mod 


stem.leaf (EchantillonsNormaux$obs, trim.outliers=FALSE, na.rm=TRUE) Variable (une) 
obs 
Fenêtre de sortie = 
Chiffre des feuilles : Automatique M au définir : 1 | Ï 
> stem,leaf(EchantillonsNormaux$obs, trim.outliers=FALSE, na.rm=TRUE) Parties par feuille 
1 | 2: represents 1.2 Automatique @) 
leaf unit: 0.1 1 O 
n: 100 
2 
3 =2* 001 O 
7-1. | 6889 : O 
14 -it | 0222444 Styles des divisions de tiges 
29 <03 555666677777799 Tukey © 
48 -0* 0000000111222223444 Chiffre de tiges répétés ©) 
(25) 0* | 0000111122333333444444444 Options 
27 0; 5667777188889999 Eirenecetrense Æ 
dL 1* 000113 
5 1. | 559 Montrer les niveaux 12 
2 2* | 23 Inverser les feuilles négatives [M 


Messages 


[14] NOTE: Le jeu de données EchantillonsNormaux a 100 lignes et 1 colonnes. 


C7 | #3 JE3 


Fichier Edition Don 


Graphes dc 
R, ovés:| Etanorman va 


Fenêtre de script 


Distributions Outils 


EchantillonsNormaux <- as.data.frame (matrix (rnorm(100#*1, mean=0, sd=1), ncol=1)) 
rownames (EchantillonsNormaux) <- paste("sample", 1:100, sep="") 

colnames (EchantillonsNormaux) <- "obs" 

EchantillonsNormaux(1:10,] 


stem.leaf(EchantillonsNormaux$obs, trim.outliers=FALSE, na.rm=TRUE) : R RGrapmos Device 2 (AGIIVE) 
Fichier Historique  Redimensionnement 


Hist (EchantillonsNormaux$obs, scale="frequency", breaks="Sturges", col="darkgray") 


C 338] 
| 
Variable (une) 
Fenêtre de sortie le 
La 
> EchantillonsNormaux[1:1 | ao 
[1] 0.96909153 1.1509€ 1 0.76325761 -0.464 LS 
Nombre de classes : |<auto | | . 
> stem.leaf(EchantillonsN Echelle des axes QUE) É ns 
1 | 2: represents 1.2 Fréquences (©) 2 
leaf unit: 0.1 Pourcentages ©) F4 = 
n: 100 Densité le) E 7 
3 =2% | ‘001 
7 -1. | 6889 EC Annuler Aide Lo 
14 —1* | 0222444 
29 -0. | 555666677777799 
48 -0* | 0000000111222223444 
(25) O* | 0000111122333333444444444 
27 0. | 5667777788889999 
11 1* | 000113 
5 1. | 559 
2 2* | 23 


v 


Hist (EchantillonsNormaux$obs, scale="frequency", breaks="Sturges", col="darkgray") 


Messages 
[14] NOTE: Le jeu de données EchantillonsNormaux a 100 lignes et 1 colonnes. 


3° Création et exécution des lignes de commandes 


> Pour enchaîner les traitements ou programmer des fonctions R, il faut passer par les lignes de 
commande. On peut le faire directement dans la "console R"', mais il est plus facile d'utiliser 
l'éditeur Tinn-R car il permet de saisir, d'enregistrer et d'utiliser les lignes de code que l'on 
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crée pour un traitement ou une fonction. 


D On peut saisir et exécuter directement les lignes de commandes dans la console R (R 


Console). 


Pour accéder à la console R, il faut cliquer sur l'icône R créée lors de l'installation. Un fenêtre 
RGui (Graphic user interface) s'ouvre, qui contient, par défaut la console R, dans laquelle 
s'écrivent et s'exécutent les commandes et les fonctions R. La console R s'utilisera de 
préférence lorsque chaque ligne de commande est exécutée au fur et à mesure du traitement 
prévu. On exécute une ligne de commande en appuyant sur la touche entrée (valider). Une 
ligne peut comporter plusieurs commande séparées par des "';"". Une commande peut s'écrire 
sur plusieurs lignes, des + apparaissent alors en début de ligne. 


UTILISATION DIRECTE DE LA CONSOLE R 


Fichier Edition Misc Packages Fenêtres Aide 


> piecel <- sampleic{"Pile", Face"), size = 1000, prob = c{.4, .6), replace = TRUE) 
> (distpiecel <- table(piece1)}| 


RUE 


Fichier Edition Misc Packages Fenêtres Aide 


> piecel <- sampleic("Pile", "Face 
> (distpiecel <- table(piecel)) 
piecel 
Face Pile 

624 376 
> sumipiecel == "Pile") / 1000] 


Fichier Edition Misc Packages Fenêtres Aide 


> piecel <- sample(c("Pile", "Fe 
> (distpiecel <- table(piecel)j) 
piecel 
Face Pile 

624 376 
> sumipiecei == "Pile" / 1000 
UOTE 
> lo / 1000)| 
> 


SAISIE DES LIGNES DE COMMANDE(S) _ -— >| AFFICHAGE DU RÉSULTAT 
RTE 


Fichier Edition Misc Packages Fenêtres Aide 


> piecel <- sample(ic("Pile", "F: 
> (distpiecel <- table(piecel)) 
piecel 
Face Pile 

624 376 
> | 


"AR Gonsole 
Fichier Edition Misc Packages Fenêtres Aide 


> piecel <- sampleic("Pile", "Fe 
> (distpiecel <- table(piecel) 
piecel 
Face Pile 

624 376 
> sumipiecel == "Pile") / 1000 
[11 0.376 
> | 


RG DE ACT. |CIX) 


Fichier Historique  Redimensionnement 


02 04 06 


a 
[=] 


D Lignes de commandes saisies dans Tinn-R et exécutées dans la console R. 


Lorsque l'on veut faire des traitement par lots (exécuter plusieurs lignes de commandes 
groupées) ou programmer des fonctions, l'utilisation de l'éditeur Tinn-R facilitera grandement 
l'écriture, la vérification et l'exécution des procédures ainsi créées. 


La procédure classique consiste à suivre les étapes suivantes : 
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a Écriture du code dans Tinn-R. 


in REA TbWiGOnrMatiGonreProbeSimOlaNonMMtTiatonRA re 
ŒÆ] File Project Edit Format Marks Insert Search Options Tools R View ‘Window ‘Web Help 


‘DS-[R6 @ 8]; se;:Qu%0lis 2 444; UDeEep 


_InitionRt 


al 
2 piecel:<-:sample (c("Pile",:"Face"),:s1ize:=:1000,-prob:=:c(.4,:.6),-:replace:=:TRUE){ 
3 (distpiecel:<--table (piecel))4{ 

4 sum (piecel:==:"pile"):/:10009 

5 barplot (distpiecel:/:1000)4 


7 (LR compex [r]|flrremai(rence) D) 5 | # & |: at à @ 


b Lancer la console R (Rgui pour Graphic User Interface) à partir des menus Tinn-R. 


Pin PAM GonrMatniGoneProbasmalatonNmtnatonti re 
Œ] File Project Edit Format Marks Insert Search Options Tools (R View Window Web Help 


DS" 48 el 8/;se;:QutD|e + EEE EE n ton) 
DT Jérome [r]ffrerçs rence) DE rem  RÉTCNE 


tete I Gta , S Server (connections and tests) 


; : : pe) Configure » 

2 piecel:<-:sample (c("Pile",:"Face"),:s1 L(.4,°.6),:replace:= 
8 (distpiecel:<-:table (piecel)){ æ Send » 

4 sum (piecel:==:"pile"):/:10007 

s barplot (distpiecel:/-1000)4 : 

6 À Control L 

ni + = p 


c Copier coller les lignes de commande de Tinn-R dans la console R. Les lignes de commandes sont 
exécutées automatiquement et les résultats affichés, dans la console pour les résultats numériques, 
dans une ou plusieurs fenêtres graphiques, pour les graphiques. 


> #H*#####*#LIGNES DE COMMANDE pile ou face pas forcément équiprobable *F#######%% 
> piecel <- sampleic("Pile", "Face'"), size = 1000, prob = c(i.4, .6), replace = TRUE) 


> (distpiecel <- table iece1 = 
à 2 5 1) sr Grapmes- DErce 2 M(ACIIVE) = (E) 


pieceli 
Face Pile Fichier Historique  Redimensionnement 


597 403 
> sum(piecel == "Pile") / 1000 
[1] 0.403 
> harplot(distpiecel / 1000) 
> 


00 02 04 


3° Utilisation de fichiers contenant les lignes de commande ou les fonctions à exécuter 

Pour utiliser les exemples fournis dans des fichiers, plusieurs cas peuvent se présenter. 

D S'il s'agit de lignes de commandes fournies dans le texte d'un fichier texte, il suffit alors de 
sélectionner les lignes concernées et de les copier-coller dans la console R où elles seront 
automatiquement exécutées (sauf peut-être la dernière qu'il faudra valider) et les résultats seront 
affichés. Si on veut les modifier pour les adapter il faut soit les modifier dans le traitement de 
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texte ou bien passer par Tinn-R. 

Par contre si c'est un fichier du type pdf il risque d'y avoir des problèmes causés par le fait que 
les fins de ligne sont transformés en fin de paragraphe. Il vaut mieux donc éviter, au moins dans 
la période d'apprentissage. 

Il peut arriver, rarement, que la console R interprète mal certains caractères du traitement de 
texte, ayant un aspect visuel "normal". L'erreur est alors difficilement décelable, sauf en passant 
par Tinn-R. 


D S'il s'agit de lignes de commandes constituant une fonction, fournies dans le texte d'un 


fichier texte, on procède comme précédemment en prenant bien soin de s'assurer que la dernière 
ligne a bien été validée (dans le cas contraire un + apparaît en début de ligne). La fonction vient 
d'être introduite en mémoire. Pour l'utiliser il suffit de saisir son nom, suivi sans espace de (). 
Ce nom figure obligatoirement en début du code. Dans ce cas, ce sont les valeurs des paramètre 
par défaut, indiquées dans la première ligne du code de la fonction, qui seront prises en compte. 


Pour utiliser d'autres valeurs, il suffit de les indiquer à l'intérieur des (). Exemple : pileface() 
réalise 2000 simulations du jet de deux pièces équilibrées (cf. le IL). Pour en réaliser 6000, je 


saisis pileface(6000) ou pileface(nbsim = 6000). 


D Une bonne solution consiste à disposer des fichiers texte au format Tinn-R (extension .r) 
contenant les lignes de codes voulues. Un fichier Tinn-R est un simple fichier texte basique. Il 
peut contenir les lignes de code de une ou plusieurs procédures, les lignes de code de une ou 
plusieurs fonctions ou un mélange de lignes de procédures et de ligne de fonctions, comme par 
exemple dans le fichier "InitiationR1.r"" qui contient les lignes de code des procédures et les 
lignes de codes des fonctions présentées dans les tableaux du IX. 

Il suffit alors de copier-coller les lignes de code que l'on veut exécuter. 


D Une autre solution pertinente lorsqu'il s'agit d'utiliser une fonction, consiste à la faire lire et 
charger directement depuis le fichier source sur le disque dur. Prenons l'exemple de la fonction 
IFexact1(), dont les lignes de code sont dans le fichier IF BinomialExactl.r. Il peut d'abord 
indiquer à R le dossier par défaut dans lequel se trouve le fichier à charger, en utilisant le menu 
« Fichier-Changer le répertoire courant ». Puis taper dans la console R, la commande 
source("IF BinomialExact1.r"'). Pour exécuter la fonction, il suffit ensuite de taper Ifexact1() 
ou, par exemple, IFexact1(n = 150, p = .2, kobs = 25, proba = .95). 


II - QUELQUES EXEMPLES SIMPLES COMMENTÉS 


Convention typographique : Les lignes en orange contiennent les lignes de commande R. Les 
lignes en italique vert sont des parties de réponses de R (à ne pas coller dans la console). Les textes en 
turquoise ou bleu clair contiennent le code des fonctions R. Les # commentaires sont en noir, 
précédés de #. Les mots en rouge sombre sont les mots réservés aux commandes et fonctions internes 


de KR. 


#**LIGNES DE COMMANDE pile ou face pas forcément équiprobable ** 
piecel <- sample(c('"Pile", "Face"), size = 1000, 
prob = c(.4, .6), replace = TRUE) 
(distpiecel <- table(piecel)) 
barplot(distpiecel / 1000) 


<- est la commande d'affectation. C({) 
créé un vecteur (au sens informatique). 
sample tire size(1000) fois avec remise 
dans l'ensemble {'"Pile", "Face"}, avec 
une probabilité de 0,4 pour "Pile" et de 


deuxpieces <- paste (piecel,piece2, sep = "") 
table (deuxpieces) 
barplot (table (deuxpieces) / 1000) 


sum(piecel == "Pile") / 1000 0,6 pour "Face". Les n(1000) résultats 
obtenus sont mis dans le vecteur piecel. 
table (piecel) effectue le tri à plat 
(tableau des effectifs) de la série 
obtenue. 
barplot effectue le diagramme en barre. 
sum(piecel == "Pile") compte le nombre 
de "Pile". 
#*X*LIGNES DE COMMANDE pile ou face avec 2 pièces différentes ** 
piecel <- sample(c('"Pile", "Face"), size = 1000, La pièce 1 est déséquilibrée, la pièce 2 
prob = c(.4, .6), replace = T) non. 
piece2 <- sample(c('"Pile", "Face"), size = 1000, 
prob = c(.5, .5), replace = T) paste réuni deux à deux chacun des 1000 


résultats de piecel et piece2, par 
exemple PileFace ... 


Ministère de l’éducation nationale, de la jeunesse et de la vie associative (DGESCO) 


Mathématiques - Probabilités et statistique 
http://eduscol.education.fr/proq 


Page 62 sur 70 


#**FONCTION jet simultané de 2 pièces identiques équilibrées** 
pileface <- function(nbsim = 2000){ 
resultats <- rep(NA, 3) 


names (resultats) <- c('deuxpils", ‘deuxfaces", "autre") 

for(i in 1:nbsim){ 

pieceA <- sample(c("Pile", "Face"), 1) 

pieceB <- sample(c("Pile", "Face"), 1) 

if (pieceA == "Pile" & pieceB == "Pile") { 

resultats[1] <- resultats[1] + 1} else { 
if(pieceA == "Face" & pieceB == "Face") { 
resultats[2] <- resultats[2] + 1} else { 
resultats[3] <- resultats[3] + 1 } 


} 
} 
print (resultats) 
print(resultats / nbsim) 
barplot (resultats / nbsim) 
} 


Fonction effectuant nbsim (2000) lancers 
de deux pièces. 

Paramètres et valeurs par défaut,début 
du corps de fonction 
Initialisation d'un 
composantes 

nommer les 3 composantes du vecteur 
début de la boucle des nbsim lancers 
pieceA équilibrée 

pieceB équilibrée 

comptage des "Pile Pile" 

comptage des "Face Face" 

comptage des autres résultats. 

Fin des tests et 

des boucles 

Affichage des résultats. 


"vecteur" à 3 


Fin du corps de fonction. 


#Le problème historique du grand duc de Toscane (Somme de 3 dés) 
#*X*X*X*LIGNES DE COMMANDE Simulation GrandDuc**** 


del <- sample(c(1:6), 1000, replace = TRUE) 
(distdel <- table (del)) 
barplot (distdel / 1000) 
de2 <- sample(c(1:6), 1000, replace = T) 
(distde2 <- table(de2)) 
dev.new () 
barplot (distde2 / 1000) 
de3 <- sample(c(1:6), 1000, replace = T) 
(distde3 <- table (de3)) 
dev.new () 
barplot (distde3 / 1000) 
de <- del + de2 + de3 
(distde <- table(de)) 
dev .new () 
barplot (distde / 1000) 
nbneuf <- sum(de == 9) 
nbdix <- sum(de == 10) 
cat ("Fréquence des neuf =", nbneuf / 1000, "\n") 
cat ("Fréquence des dix =", nbdix / 1000, "\n") 
barplot(distde, xlab = "Somme des numéros des 3 faces", 


ylab = "Effectifs simulés'", 
main = paste ("Diagramme en barre de 1000 simulations\n du jet 
de 3 dés équilibrés")) 


1000 jets d'un dé équilibré, la série 
des 1000 résultats est mise dans le 
vecteur del 

tableau des effectifs de la série 
obtenus 

diagramme en barres 


ouvre une nouvelle fenêtre graphique 
même chose avec un autre dé équilibré, 
la série des 1000 résultats est mise 
dans le vecteur de2 


même chose avec un autre dé équilibré, 
la série des 1000 résultats est mise 
dans le vecteur de3 


somme, composante à composante des 3 
vecteurs, les 1000 résultats sont mis 
dans le vecteur de. 


Tableau des effectifs de la série de, 
diagramme en barres 

comptage du nombre de neuf et du nombre 
de 10. 


affichage des résultats. 


#*X**X*FONCTION simulation Grand Duc****xxxxx 
simgrandduc <- function (nbsim=1000){ 


del <- sample(c(1:6), nbsim, replace = TRUE) 
de2 <- sample(c(1:6), nbsim, replace = TRUE) 
de3 <- sample(c(1:6), nbsim, replace = TRUE) 


de <- del + de2 + de3 
distde <- table(de) 
print(distde) 
barplot(distde / nbsim) 


La fonction effectue nbsim lancers de 3 
dés. On additionne les résultats obtenus 


tableau des effectifs des 1000 sommes 
obtenues et leur diagramme en barres. 


#**LIGNES DE COMMANDE probabilité Grand Duc*****xxxx 
#**Somme des valeurs des faces obtenues en jetant 3 dés** 
#***kCalculer avec le modèle mathématique "exact"*x*xxx 
#**x*xConstruire l'univers correspondant à cette expérience*** 
serieS3de <- array(data = NA, dim = c(6, 6, 6)) 
for(i in 1:6){ 
for(j in 1:6){ 
for(k in 1:6){ 
serieS3deli, 


} 


SRI Fi rE 


} 
} 


serieS3de 
(distS3de <- table (serieS3de)) 
nbneuf <- sum(serieS3de == 9) 


nbdix <- sum(serieS3de == 10) 

cat('"Probabilité de neuf =",nbneuf / 216,'"\n") 
cat("Probabilité de dix =",nbdix / 216,"\n") 
dev.new() 

barplot(distS3de) 

graphics.off() 


Initialisation d'un tableau de 
dimension3 


boucles imbriquées pour parcourir tous 
les triplets possibles et générer 
l'univers des résultats possibles les 
216 valeurs obtenues sont mises dans le 
vecteur serieS3de. 


Tableau des effectifs 


Comptage du nombre de 9 et de10 
calcul de la probabilité. 
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#**Fonction probabilité Grand Duc***xxxxxx 
probgranduc <- function(){ 
serieS3de <- array(data = NA, dim = c(6, 6, 6)) 
for(i in 1:6){ 
for(j in 1:6){ 
for(k in 1:6){ 
serieS3deli, j, k] <-i+j+k 
} 
} 
} 


serieS3de 

distS3de <- table(serieS3de) 
nbneuf <- sum(serieS3de == 9) 
nbdix <- sum(serieS3de == 10) 


cat("Probabilité de neuf =",nbneuf / 216,"\n") 
cat("Probabilité de dix =",nbdix / 216,"\n") 
print(distS3de) 

barplot(distS3de / 216) 

} 


Même chose sous la forme d'une fonction. 


##H#H#H#H#LIGNES DE COMMANDES-- CALCULS DE PROBABILITÉS #HHH#H4H#HHHit#ff 
D Loi binomiale --------------- 

# Calcul de P(A <= X <= B), X étant une v.a. de distribution 
# binomiale 

# de paramètres n=100 et p=0,52. 

# Les exemples choisis peuvent servir de base à une réflexion 
# sur les différentes façons de déterminer un intervalle de 

# fluctuation, à partir 

# de l'exemple 1 (Monsieur Z du document d'inspection). 

# P(42<=X<=62) : 

sum(dbinom(42:62, 100, .52)) 

# P(43<=X<=62) : 

sum(dbinom(43:62, 100, .52)) 

# P(42<=X<=61) : 

sum(dbinom(42:61, 100, .52)) 


# P(X<=41) ; P(X<=42) ; P(X<=43) : 

pbinom(41:43, 100, .52) 

#————- Combinaisons et loi hypergéométrique -------- 

# Calcul de P(X=3) ; x=3 ; X de loi hypergéométrique de 
paramètres 


#m=3,n=5,k=14, 
(proba <- choose(3, 3) * choose(5, 4-3) / choose(3+5, 4)) 


42:62 génère la suite des entiers de 42 
à 62 

dbinom génère un vecteur des 
probabilités binomiales de P(X=42) à 
P(X=62). sum en fait la somme 


choose calcule les combinaisons 


dhyper calcule les probabilités 


# Pour vérification : hypergéométriques. 
(proba <- dhyper(x = 3, m=3, n =5, k = 4)) 
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# **LIGNES DE COMMANDES ****** SIMULATIONS NUMÉRIQUES ***x*x 
# Illustration graphique de la loi des grands nombres : 
# Lorsque n augmente, on observe les suites de distributions 
# Les fréquences tendent vers une valeur limite la probabilité 
# Les écarts à cette valeur limite sont de plus en plus faibles 
# 
nechant <- rep(c(10, 20, 50, 100, 500, 1000), 
c(20, 20; 20, 20; 20; 20)) 
simfreqar <- c(rbinom(20, 10, .3)/10, 
rbinom(20, 20, .3)/20, rbinom(20, 50, .3)/50, 
rbinom(20, 100, .3)/100, rbinom(20, 500, .3)/500, 
rbinom(20, 1000, .3)/1000) 
dev.off() 
plot(nechant, simfreqar, xaxp = c(0, 1000, 10), 
main = "Distributions des fréquences des succès") 
dev.new () 
plot(as.factor(nechant), simfreqar, 
xlab = "Échantillons par tailles", 
ylab = "Fréquence des succès", 
main = "Résumé des distributions") 
Distributions des fréquences des succès 
e 1 © 
= LE œ@ 
Le} 
=: < œ 
Le) Q 
o° $ g 
G © 
ë a J d. ê j 
E ? o 8 
: ne - 
S 1 89 6 
Le) 
S1* 
= D Le] 
T T T T T T T T T T T 
0 100 200 300 400 500 600 700 800 900 1000 
nechant 
Pour s'entrainer : Réaliser cette simulation sous forme d'une 
fonction paramétrable... 


On génère les tailles d'échantillons 
comme suit 

20 répétitions du nombre 10, 20 
répétitions du nombre 20, ….., 20 
répétitions du nombre 1000, mise dans 
nechant qui constituerons les abscisses 
des points à tracer. 

20 nombres au hasard sont tirés dans une 
distribution binomiale(10, 0,3), 20 
nombres au hasard sont tirés dans une 
distribution binomiale(20, 0,3), …, 20 
nombres au hasard sont tirés dans une 
distribution binomiale(1000, 0,3), Les 
fréquences sont calculées en même temps. 
Nuage de points des fréquences en 
fonction des tailles d'échantillons. 
Résumé des séries de 20 valeurs 
(binomiales) sous formes de boites à 
moustaches. 


Résumé des distributions 


ccès 
] 


T T T T T T 


10 20 50 10€ 500 1000 


Échantillons per tailes 
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Annexe 5 Méthode de Monte-Carlo * 


La méthode de Monte-Carlo est une méthode probabiliste permettant le calcul approché d’intégrales 
(simples ou multiples) de fonctions quelle que soit leur régularité. C’est cette propriété qui explique 
son intérêt par rapport aux méthodes déterministes classiques. 


1 
Pour simplifier cette présentation, on suppose que l’on cherche à calculer p -| f()dx pour une 
0 


fonction continue sur [0,1] à valeurs dans [0,1]. 


A. Méthode dite du « rejet » 


Comme p est donc l’aire du domaine D = {(x, y)e[0,1P/y<f (x)} , une première méthode possible 


est de tirer aléatoirement un grand nombre de points du carré [0,1]? et de faire le quotient entre le 
nombre de points situés dans le domaine D et le nombre total de points. 


Exemple 
On peut voir sur la figure 17 ci-dessous le résultat graphique dans le cas de la fonction 


= —x2+1). 


1 
Avec N=10000 points, une exécution de l’algorithme donne une valeur approchée de [ f(x)dx 
0 
égale à 0,6056. 


La valeur exacte est * &0,6111. 


Code de l'algorithme 


Ÿ VARIABLES 
N EST_DU_TYPE NOMBRE 
x EST_DU_TYPE NOMBRE 
y EST_DU_ TYPE NOMBRE 
i EST_DU_TYPE NOMBRE 
u EST_DU_ TYPE NOMBRE 
aire EST_DU_TYPE NOMBRE 
# DEBUT_ALGORITHME 


LIRE N 
u PREND LA VALEUR 0 
w POUR i ALLANT DE lAN 
DEBUT_POUR 
x PREND_LA_ VALEUR random() 
y PREND_LA VALEUR random() 
W SI (y<=F1(x)) ALORS 


DEBUT_SI 
u PREND LA VALEUR u+1 
TRACER POINT (x.y) 
FIN_SI 
FIN_POUR 
AFFICHER u 
aire PREND_LA VALEUR u/N 
AFFICHER aire 
FIN_ALGORITHME 


Figure 17 : tirage de 10000 points de [0,1]? 


7 Ce paragraphe peut être réservé à une seconde lecture : son contenu n’est pas au programme mais peut être 
traité dans le cadre de l’accompagnement personnalisé en TS. 
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Voici ce que donne l’algorithme pour la fonction 
f(x) = Ent(10x)/10 où Ent désigne la partie entière. 

On voit que la méthode fonctionne même avec des fonctions 
présentant des discontinuités. C’est son avantage sur les 


méthodes de calcul approché classiques  (trapèzes, 
Simpson, .…). 


Document associé : monte carlo.alg 


Justification 
On considère deux variables indépendantes X et Y suivant la loi uniforme sur [0,1]. 


On admet que PE < f(X )) = p. L'exemple ci-dessous permet de vérifier cette propriété sur un cas 
particulier. 
Si on considère (X LÀ ), su (4 Y, ) n couples de variables aléatoires indépendantes suivant la loi 


mn 


uniforme sur [0,1], on a P(r, £ f(X4)) = p pour tout X e{l.,n} ù 
Si S, représente le nombre de couples (X b%) tels que Y, < f(X,), alors S$, suit une loi binomiale 


n 


: . S 
de paramètres n et p. La loi des grands nombres permet d’affirmer que la suite | | converge en 
P P 8 P q : 8 


s, 
—  —P 


probabilité vers p c'est-à-dire que pour tout e>0, Pl 
n 


> ] — 0 quand n tend vers l’infini. 


Sion génère avec un ordinateur un grand nombre de couples aléatoires (X mA ) , la proportion f de 
ces couples pour lesquels Y, < f(X,) fournit donc une valeur approchée de p. 


De plus si n>30 et nf>5 et n(1- f)>5 alors l’intervalle | [es un intervalle de 


il 1 
ET 
confiance de p au niveau 0,95. 

Avec n=10000 on obtient une précision de 0,01 avec une confiance de 0,95. 
Exemple 

On prend ici la fonction f définie par f(x) = x? et on pose Z = f(X)-Y = X?-Y où les deux 
variables indépendantes X et Y suivent la loi uniforme sur [0,1]. 

Ona p=P(Y<X?2)=P(Z2>0). 


g(x)=vVx+l si xe [-10] 


On admet que la densité de Z est la fonction g définie sur [-1,1] par 
g(x)=1 x si xe [0,1] 


1 
Alors P(Z > 0) = [ g(x)dx = = 


26 Voir annexe 1. 
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B. Méthode de l'espérance 


On admet le résultat suivant : 


Si X est une variable aléatoire suivant une loi uniforme sur [0,1] et si f est une fonction continue sur 


1 
[0,1] alors la variable aléatoire Y = f(X) possède une espérance égale à p = | foodx 7 
0 


L’exemple ci-dessous donne une approche de ce résultat. 


Si on considère n variables indépendantes X,,..,X, suivant une loi uniforme sur [0,1], alors la 
D SA) 
variable 1 converge en probabilité vers p. 
n 
Exemple 


On prend ici la fonction f définie par f(x)=-In(1l-x) pour xef0,I[ et on pose 
Y=f(X)=-M({1-X) où X suit une loi uniforme sur [0,1]. 


Ona P(Y<x) =P{x<1-e") =1-e * pour xe[0,+00[. 
Donc } suit une loi exponentielle de paramètre 1. On sait alors que E(Y)=1. 


1 
Le calcul de l’intégrale [ —In(1- x)dx est un exercice classique d’analyse. 
0 


" VARIABLES 
x EST_DU_ TYPE NOMBRE 2 
N EST_DU_TYPE NOMBRE Avec N=10000 et la fonction f(x)=<(x" -x2+1), une exécution 
S EST_DU TYPE NOMBRE 3 


i EST DU TYPE NOMBRE 


aire EST DU TYPE NOMBRE de l’algorithme donne une valeur approchée de 0,6101. 


" DEBUT_ ALGORITHME Il peut être intéressant de comparer l’efficacité des deux méthodes. 
S PREND_LA_ VALEUR 0 : ee 7 
UREN _ — On peut constater que la méthode de l’espérance est en général un 
W POUR i ALLANT DE 1 AN peu plus précise. 
DEBUT_POUR 


x PREND _LA VALEUR random() 


5 PREND_LA VALEUR 5+F1(x) Document associé : monte Carlo bis.alg 
FIN_POUR 


aire PREND LA VALEUR S/N 
AFFICHER aire 
— FIN_ALGORITHME 


Remarque 


La méthode de Monte-Carlo est couramment utilisée pour calculer des aires ou des volumes. Elle est 
plus aisée à mettre en œuvre que des méthodes déterministes. 


27 C’est un cas particulier d’un théorème de probabilité connu sous le nom de « théorème du transfert ». 
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Annexe 6 Comparaison de deux frequences et difference significative 


A. Une situation tres fréquente en sciences experimentales et en economie 


Une situation très fréquente dans les démarches expérimentales est d’avoir à comparer deux séries de 
mesures, ou deux fréquences, pour étudier par exemple l’influence d’un facteur. On peut alors utiliser 
un test de comparaison (mais il s’agit alors d’une « boîte noire » dont on ne peut que difficilement 
justifier le fonctionnement au niveau des classes de terminales) ou, ce qui est souvent pratiqué dans les 
autres disciplines, comparer deux intervalles de confiance ou « barres d’erreurs ». 


Exemple 1 : erreurs de mesure 

Un document traitant de « l’estimation des incertitudes sur les erreurs de mesure » (Université de 
Strasbourg — Sciences physiques) indique qu’on peut « comparer des valeurs de façon très simple, par 
comparaison des segments d’incertitude » (il s’agit généralement d’intervalles de confiance à 95 %). 
«Les segments doivent avoir une partie commune ; dans le cas contraire, soit l’incertitude est trop 
faible (mauvaise évaluation de l’erreur), soit il y a un résultat erroné. Cette méthode est intéressante 
pour une comparaison globale de résultats expérimentaux, provenant par exemple d’expériences 
différentes. » 


Exemple 2 : prévalence du chikungunya à Mayotte 


Séroprévalence spécifique du CHIK par âge 


(N= 1154), Mayotte, 2005-2006 


Séroprévalence globale pondérée % [IC 95%] = 37,2 [33,9 - 40,5] 


lencæ (%) 
AN 
[e) 


$ 20 
Ê 10 
(0) 


2-14 15-24 25-34 35-44 45-54 > 55 
Age, années 


Barres d'erreur représentent l'intervalle de confiance à 95% 


Deux intervalles de confiance non disjoints : pas de différence significative. 


Le paragraphe qui suit, bien que s’appuyant sur un certain nombre de résultats admis, a pour objectifs 
de donner des éléments de justification du critère retenu en terminale STI2D-STL pour juger d’une 
différence significative de deux proportions. 
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B. Comparaison de deux frequences 


On souhaite comparer les proportions p. et p, d'un même caractère, dans deux populations distinctes, à 
partir de l’observation des fréquences ji et f observées sur un échantillon de chacune des deux 
populations. La question posée est de savoir si la différence fi — f; est significative. 


On suppose que les proportions des deux populations sont les mêmes : p1=p2. 

Sous cette hypothèse d’égalité des proportions des deux populations, la variable aléatoire F — F,, qui 
à chaque paire d'échantillons de taille n, et », respectivement issus de chacune des deux populations, 
associe la différence f; — f; des fréquences observées, suit approximativement pour n, et 72 assez 


AO), RO-A), 


un mn; 


grands, la loi normale W(0, 


Remarque 

L’espérance de la variable F- F;, égale à la différence p ; — p est nulle compte tenu de l’hypothèse. 
La variance de la variable F.- F, est égale à la somme des variances car les variances s'ajoutent si l'on 
suppose les variables F'; et F; indépendantes. 


Dans ces conditions, on peut déterminer l’intervalle de fluctuation de la variable F; — F; au seuil de 
5%, d’où : 


P(196 2 2h = 106 20 = 095. 


n n; n n; 


On conclut en disant que l’observation d’une différence fi — f;, obtenue à partir des fréquences 


FUN, A0) 
mi 


M 


observées, vérifiant | = f1> 196 remet en question l’hypothèse p1 = p2 


puisque avec l’hypothèse p, = p2 cette situation n’a que 5% de chances de se produire. 


C. Intersection de deux intervalles de confiance 


Conformément aux notions présentées en classe de terminale, on peut déterminer à partir de 
l’observation ji, un intervalle de confiance pour la proportion p, au niveau de confiance de 95% : 


_196 AUS) fA=f) 
1 1,96 . , fi +196 " | 


De même, on peut déterminer, à partir de l’observation f;, un intervalle de confiance pour la proportion 
p2 au niveau de confiance de 95 % : 


E PE, ER) 
m 125 


On peut alors décider qu’il existe une « différence significative » entre fi et f2 lorsque les 
intervalles de confiance précédents sont disjoints, c’est-à-dire lorsque : 


A0 EE ER) 
ni 


M 


Si l’on compare ce critère de « différence significative » au précédent, on constate qu’il est 
plus « sévère » puisque : 


En ER > AOL 


un Le) nm M 
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Le théorème de Moivre-Laplace. 


Une démonstration complète dans le cas p — 1/2. 


1 - Enoncé du théorème. 


2 - Démonstration du théorème de Moivre-Laplace lorsque p = 1/2. Lay 
e 


NE 


a - Les étapes de la démonstration. b - Convergence de f,(t) vers 
4 - Calcul de l'intégrale de Gauss. 
5 - Démonstration du théorème de Moivre-Laplace lorsque p # 1/2. 


6 - La loi des erreurs. 


1) Enoncé du théorème. 


Théorème 1. On suppose que pour tout n, X, suit la loi binomiale B(n, p) avec p € 0, 1. 
Xn — np 


vpan 


On pose Zn = avec q = 1 — p. Alors pour tous réels a et b tels que a < b, 


b 
dt 
lim P(a < Zn <b) = D 
D ee oo. 
Nous commençons par le cas p — 1/2. Le résultat suivant se démontre avec des outils 
accessibles au niveau terminale (rappelons que cette démonstration est hors programme). 


Théorème 2. On suppose que pour tout n, X, suit la loi binomiale B(n,1/2). On pose 
Xn —n/2 
SE 
n/2 
indépendant de n tel que 


. Alors pour tous réels a et b vérifiant a < b, il existe un réel K > 0 


(1) 


T T T 1 
0 200 400 600 800 1 000 


—— (a 
ä V27T 


Remarquons que X, prend des valeurs entières & comprises entre 0 et n, et donc Z, prend 
k—n/2 
n/2 
et b sont dans le même intervalle [t4,tx41] avec a > 0 et b— a > 1//n (possible car 

ter — tx = 2/Vn), alors P(a < Z, < . = 0 et donc 


. La vitesse de convergence en 1/4/n est optimale puisque si a 


les valeurs t} — 


b __Z2 
fe dt —12/2 dt S € i°/2 


€ ————+ 
V _ . V27T V27mn 


P(a < Z, < b) — 


2) Démonstration du théorème de Moivre-Laplace lorsque p = 1/2. 


a) Les étapes de la démonstration. 


Nous allons construire une fonction en escalier f, telle que P(a < Z, < b) = Tata 


où a, est proche de a et b, est proche de b (P(a < Z, < b) est l’aire du domaine représenté 
—t2/2 


Nr 


sur la figure 1 lorsque a = —1, b = 2 et n — 192), et telle que f,(t) est proche de 


—+12 2 


FIGURE 2 — Représentation graphique de f, et de la fonction € — Re 


Définissons tout d’abord la fonction en escalier fn : pour tout k tel que 0 < k < n, f, est 
constante égale à VRP(X, = k) sûr J, = |fi — st + LL et f, est nulle en dehors de 
l’union de ces intervalles. 


— n/2 
Proposition 3. Si ty — EL , k' = min{k; {4 € [a,bl} et k” = max{k; tx € [a,bl}, 
1 1 . 
FT Le a et bn = ty + n dors Pa, <bj= . Fate )dé 
tr +1/Vn 
Preuve. Par la formule de l’aire d’un rectangle, / POP P Ze) 
te) VA 
On a donc : ‘ 
k!! k!! te +t1/Vn bn 
P(a < Zn < b) = Pfty < Zn < tr) = D P(Za = tx) = ne fatbdt= |  fa(tjdt 
k=k/ k=k ‘te—1/Vn an 


Proposition 4. Si À = sup{|a|,|b|} et n > A4?, alors 


_ Le b 2/2 
| als 


0,5 — 


FIGURE 3 — L’aire de la réunion des deux domaines représentés est égal à 7 
(dsl; nm 107). 


Preuve. En effet, 


bn et?/2 —t2/2 —t2/2 —12/2 
dt — a <| [ST = al+| [7 S TE à] = 1 "+ 
[. en 1 2 


Comme n > 4°, alors to = —4y/n < a et ty = ÿ/n > b, donc 1 <k' <k"<n—1, 
d'où ty_1 = ty — F < a <ty, et comme an = ty — NL on à |a — an] < a De plus, 


| < 1/2, par conséquent 1, < ==. De même, |b— b,| < + 


42 
È | 7 LD < < 
Le résultat suivant montre que f, est proche de Emi V2r et est démontré en section 3. 


—t2/2 


e > C 
Var | Vn 
Le théorème de Moivre-Laplace découle facilement de ces propositions. En effet, d’après 
la proposition 3 et l’inégalité triangulaire, 


b 
in n dt 
P(a < Zn < b) — en he < |f n(t)dt — 4 en 
( V2T fat n V2T 


4 M dt UE 
V2 


D'après la proposition 4, le deuxième terme de droite est majoré par 1//n, et d’autre 
part, d’après la proposition 5, 


bn he bn C(b — a +2) 
n(t)dt — ni <f” + dt < t< 
| a fe 2717 Ja, (0 | : E vVn 


3 


Proposition 5. Il existe C'>0 tel que sit € [as, b,] etn>44?, alors 


fn(t)— 


__42 
e-t2/2 


V2T 
Nous allons montrer la proposition 5 : il existe C > 0 tel que si n > 44?, alors pour tout 
+42 
tE (an, bnl, |fn(t) — <——. Ceci résulte des deux propositions suivantes lorsque n 
A à 


e 
est pair. Le cas n impair est traité en fin de section. 


b) Convergence de f,(t) vers 


0,5 - 


FIGURE 4 — Comparaison des graphes de f, et de la fonction x — exp (—x?/2)/V2 . 


1 
Proposition 6. Sin > 2 est pair, alors 1 — — < V2rf,(0) < 1. 
n 


Ceci implique, d’après le théorème des gendarmes, que lim AU = 

pliq P 8 que _ lim À (0) = 
Proposition 7. Sin > 2 est pair, alors fi(tx) < fh(0). Si de plus n > 44? et [ty] < À, 
il existe un réel L > 0 tel que 


Jn(0) vn 
Preuve de la proposition 5 pour n pair. 
Sin > 44? ett € [as,b,], il existe 4 tel que k' < k < k” et t € Jy car l’union des J} 
pour k' < k < k” est égale à [a,,b,]. Par conséquent, fh(t) = fu(tx) et [e-"/2 — e-F 12] < 
lé — tx] < " !, Comme k' < k < k"”, on a |f4| < À, et donc, d’après la proposition 6 et la 
proposition 7, 


| V2r f,(t) — er re] 


A) 
fn (0) 


| V2r fa (0) — 1| + pe _ ertk/?)] + le-#/2 =. e-# 2) 


PA 


1 E 1 L+2 
+ + < 


Nous démontrons maintenant les propositions 6 et 7. Les valeurs de la fonction f, font 
intervenir les coefficients p, 1 = P(X, = k) où X, suit la loi binomiale B(n, 1/2). Le lemme 
n! 


suivant donne une propriété des p,, x (propriété évidente si on sait que () = FAT 
ln —k)! 


1. voir exercice en partie [I 


emme 8. Dn ne 
Pn,k+1 FE] Pn,k 


Démontration par récurrence sur n. Comme Pyk = ( ) /2°, il suffit d'établir : 
k 


n n — k n 
P, but DSÉSueT ( VE () 
(Pr) PRE Fer k+1 k+1 


La propriété (P.) est vérifiée puisque p11 = p10 = 1. Si (P,) est vérifié et si 0 < k < n, 
n+1l n n 
on a alors, en utilisant la relation de Pascal ( ) = ( ) + ( ) et la relation (P;) : 
k 


(k+1) (7) 


k+1 


an )+u+0() 0-0) +040) 
= (a+) AG) 0-24 0) +0) 


= (n+1- (7) 


Lemme 9. Soit Dm — Pamm la probabilité d'obtenir m piles après avoir lancé une pièce 


2 
— < mrph SL 


2m 


2m fois. Alors 


Notons m! le produit des entiers de 1 à m. En appliquant le lemme 8, on obtient 


m+1l (m+1)(m+2)::.2m (2m)! 


PAR SD 0 Dan 


Pm — Pam,m — 


1 
Posons 1, — | (1— #2)? dt. La suite (1,) est décroissante. 
0 


1m 


En effet, si t € [0,1], alors (1—#2)"2 <(1-—+2)?. En intégrant, Li < Lo. 


FIGURE 5 — graphe des fonctions £ — (1 — #2)"/2, 


On a Lo = 1, 1 = 7/4 (aire du quart du disque unité), et la relation de récurrence 


Do ——),,.;: 
m + 1 - 


La 
2 


En effet, si f(t) = t(1 — t?) 
entre 0 et 1. 


, il suffit de calculer f'(t) et d'intégrer la relation obtenue 


En itérant la relation de récurrence, 


2m 2m 2m—2 2 PRO) 1 
2m — 3. 4 12m-1 — c++ lo = =. (2) 
2m +1 2m+12m—1 3 (2m +1)!  (2m+1)p» 
de même, 
2m—-12m—-3 3 (2m)! T (2m)! x 7 
Lm-1 = —h= 29 — 92 25 — DPm 
2m 2m—2 4 [2m(2m — 2)... 2] 2; 26m); - 2 
Dm 1 a 
et donc : — (1 + 5 ÿmrp?,. Comme (1,,) est décroissante, J2» < Lom-1 < 12m-2; €t 
2m m 


bis 1 LS 
—. — 1 = d’où le résultat. 


1 
en divisant par ln, on à 1 < (1 + 5 TD < 
m 


I nT 9 
er D Pm < 1. Ceci 


résulte du lemme 9. Or, fh(0) = Vpn. On conclut en prenant la racine carrée. 


1 
Preuve de la proposition 6. Si n — 2m, alors (1 — —)? 
n 


Nous utiliserons dans la démonstration de la proposition 7 les résultats suivants : 


1 = 
Lemme 10. 1 — exp{—2x +e(x)}, QUEC lE(x)| S 5 si || = 1/2. 
TX 


Un calcul donne e(u) = In(1 — u) — In(1 + u) + 2u et . 2 . Si lu] < 1/2, on à 
—3u? < e'(u) < 3u?. En intégrant entre 0 et x, on a —x* < e(x _ 


Kq 


e1 = 
l(£—1 
Lemme 11. Si{ > 1, alors 5 — ; ) et DU < {*/4 (par récurrence). 


i=1 i=1 


EN 
| 
E+ 


Il résulte de ces deux lemmes que si{,meNet sil <£{<m/2et si w = = , alors 
IT (+7) 
i=1 
81 1 
—2  L 1 € 
= — | < — HR 
Ve = exp( mm 2 UT ave | Let Is Lt i/m)| < 7 2° = 
n t n nm nm 
Preuve de la proposition 7. Si n — 2m, alors . u — Prk, Comme Gi _ ( :)S on 
n Pm Le 
2mm—1 


peut supposer que k > n/2. Le produit des relations pan i+1 = Pami POUr À variant 


i+1 
de m à k—1, donne : 
FAO TS ie Dm DCE 


6 


10 


FIGURE 6 — La suite (we) (ici m = 96). 


(6) _m 

= VE mm: 
fn(0)  _k 
Ceci implique f,(t) < f,(0), ce qui est également vérifié si { n’est dans aucun ./, car dans 
ce cas fh(t) = 0. Supposons de plus que |t4| < À et n > 447. 


Comme k — m = /ntx/2, (k —m)/m = tx/Vn <1/2 et (k—m)?/m = 12/2, on a: 
_k-m k—m tk À 


Ja(tx) — 
fh (0) — Ur + TE km < 5 — Vn < Vn 


En divisant chaque terme du numérateur et du dénominateur par m, 


et 


Le te _ 
Uk-m = Exp À — 21 — or +} DS (xl < 4m 8n < 8Vn 


Par conséquent, [ux-m — e-#/?] < exp {(tx +14/8)/Vn} — 1 < exp {C/Vn} — 1, avec 
C = A + A/8. D’après l'inégalité de convexité e° — 1 < xe* pour x > 0, 


[Ug mm — e”tk/2] <K/Vn avec K = Ce° 
D'où, 


Jante) 
RQ = lt rene fs Te 


fn(tx) _ 4/2 _ 
fn(0) _ 


T T 1 
Q 1 2 3 


FIGURE 7 — La fonction t — e-{”/? et la suite de points (£k, fn(tr)/fa(0)) (ici n = 192). 


Preuve de la proposition 5 pour n impair. On va se ramener au cas pair de la façon 
suivante. Rappelons que t, — "72 et notons r, — *=U=1/2 ja subdivision associée au 
- HODR 7 k Vn=1/2 


rang n — 1 (n — 1 est pair). Pour tout 1 <k <n—1,ona 7 1 < tx < 7%. Sit € Jy, alors 
tr] <lt—-ti] + lt — 7] <3/Vn et |t — 7 11 < 3/,/n. D’après la relation de Pascal, 


F Vi _ 
72 Pnk — a (Pr + Pn-1,8-1) — AA | 


Or —— > —1 <1/n, et d’après la proposition 6, V2r fn_1(7%) < 1et V2Tfn_1(7% 1) < 1, 
donc 0 < v 27 (2fn(t) he Tete) < 2/n. Par conséquent 


2| V2r fn (t) En er = : à. |V2r fn_1(7) — eTk/2| + |V2r f-1(7-1) = e-"*-1/2] 


72 = #à #2 _+2 
“= Le Re tr] +le Teil et?) 


JE) = fn-1(r#) + fn-1(7-1)) 


D’après le cas pair, [2x fn 1(Tx) —e rk/2] < C/V/n et 2x fn 1(T&-1) —e7 ré?) <C/Vn. 
De plus, Je-Té/2 — et co < mx —t| <3//n et le - 1 2 et PT < [rx —t| <3/Vn. Il 
7 
Jn() — 


€ 


LE 


existe donc une constante C” telle que 


<T 


4) Calcul de l'intégrale de Gauss. 


Théorème 12. lim et l2qt = V2. 


æ—+00 J _, 


Si G(x) = jL et/?dt, il suffit de montrer que si n = n(x) la partie entière de x?/2, alors 


TP 


1+1/ ee 
En effet, comme lim n(x) = +oo, le théorème des gendarmes permet de conclure que 
LT +00 
lim G{(x) existe et est égal à V2r. 
n—00 


Majoration. Pour tout k, P(—x < Z, < x) < 1, donc, d’après le théorème de Moivre- 
Laplace : 


CE) V2r lim P(—x < Zr < x) < V2r 


0) 


Minoration. Notons que V2n < x. Par ailleurs, pour 0 <v<1,ona(l—-vw)"<e 
(pour le voir, passer au logarithme et utiliser le concavité de la fonction logarithme). Par 
conséquent, avec le changement de variable u = t/V2n, 


x V2n 1 1 
| et > j e/2dt = va | et du > V 2 | (1— u°)"du = V2nln 
0 0 0 0 
Par conséquent, d’après (2) et le lemme 9, 


PS 


_ (2n+1)p — 14H 


8 


5) Démonstration du théorème de Moiïvre-Laplace lorsque p # 1/2. 


Notre but est de démontrer le théorème 1. Supposons que X, suit la loi binomiale B(n, p) 
7 _ : 
et posons Zn — = a avec q = 1 —p. Si X, = k, alors Zy = tx = h\(k — np) avec 
Vpqan 


1 . 
hh = =, et P(Z, = #4) = XL =É) = p,5 = KE, Soit f, la fonction défini 
on ( x) ( = Pix (,.)p"a oit fn la fonction définie 


1 nm 
par: fab) = . d hs  Lh-np2m+n/2t(t). Le graphique suivant représente f, pour 
7 k=0 
n = 192 et p — 0,2. La convergence est plus lente que pour p = 0,5 (rectangles plus gros) 
et fn n’est plus paire. 


0,5 


Î 
53 -2 -1 (0 1 2 3 


—+2/2 


V2r 


e 


FIGURE 8 — Représentation graphique de f, et de la fonction € — 


: . 
De manière analogue au cas p = 1/2, on montre que P(a < Z, < b) = fatt)dt avec 


lan — a] < h,/2 et [bn — b] < h,/2. Le résultat suivant généralise la proposition 5. Sa 
démonstration est d’un niveau plus élevé et nous ne la détaillerons pas complètement. 


Proposition 13. 1! existe une constante C' > 0 tel que pour tout t € [-A, A, 
et C 
< 


Var| 7 Vn 


Preuve de la proposition 13. Rappelons la formule de Stirling : n! — (2)"V2rn (1 +En) 
avec lim €, = 0. Plus précisément, pour tout n, 0 < €, < 1/n. Pour n et t fixés, il existe 


fn(t) ss 


n—00 
k tel que t € [t4,tx11[, d’où, en appliquant la formule de Stirling trois fois, 


Pn, n n— n! _—. 
nf) = — (.)p°a F/pqan — HDi F\/pqn = MnRa(l + Enx) 


k n—k 1 " 
avec M, = _ 1 +, Ra = —— vPq et 1+enr — (+en) 
Er) DE ME) #7 (1+ex)(1 +en à) 


Il existe une constante S telle que pour tout n, [x] < S/n. En effet, 0 < €, < 1/n, et, 
si n est assez grand, pour tout { € [—A, A], n/4 < k < 3n/4 et donc 0 < ex < 4/n et 
0 < En—k < A/n. 


Etude de WM,. Notons que kÆ = np + FE = np(1 + ux) et n —k — nq(1 + Uk), avec 
Uk = tk et Ve = —, ET et donc 


M, = exp { — npo(ux) — ngp(ux)} 
où g(u) = (1+u)In(1+u). On peut montrer que p(u) = u+u?/2+fB(u) avec [B(u)| < [u|?/3 
si u € [—-1/2,1/2]. Par conséquent, 
npolur) +nqçp(vr) = n(pux + pui/2 + pBlux) + qur + qui/2 + qE(vx)) 
= 1/2 + n(pBlux) + qB(vx)) 
Comme les {; sont dans [—A, A] il existe À > 0 tel que lux, [url < K/n < 1/2 si n est 
assez grand, et donc |pB(ux) + qB(vx)| < K%/n°/2. Par suite, 


M, = e %/2(1 + Ex) et il existe une constante M > Otelque €,4, < M/Vn 


Etude de R,. Comme À, — L ,0n a 


2r(1 +ux) (1 +0) 


1 
Rr=——(1+e!,) et il existe une constante R > Otel que €!,, < R/VNn. 
27 9 , 
er tk/2 
En conclusion, f,(t) — en (1 + dk) et il existe Co > 0 tel que 0, x < Co//n. Comme 
7 
er? C 
t—1tx] <h,, on en déduit qu’il existe une constante C > 0 tel que | f,(t) — < —. 
ft ler 
al L 
Remarque 14. Lorsque p = 1/2, il existe L > 0 tel que £ Fe HA 2 pour tout 
ñ n 


n et pour tout k < n. Des simulations numériques indiquent qu'on peut prendre L = 0,1 

(voir figure 7). L'ordre de grandeur de fr(tx) — e*/?/V9r est donc en 1/n, tandis que 

l'ordre de grandeur de f,(t)—e */?/V2r est en général seulement en 1/V/n. Ceci confirme 
—12/2 


V2r 


l’impression visuelle que la fonction f, est très proche de la fonction 


aux points ty. 


2 
etk/2 


FIGURE 9 - Suites (4, n{fa(tx) — Joker quand p = 1/2 pour diverses valeurs de n 


Par contre, lorsque p Æ 1/2, la vitesse de convergence est en 1/\/n. Plus précisément les 
42 
VD (5,(0)-Z 


k 
p—1/2 V2r 


même courbe comme indiquée sur la figure 8. 


points (éx, ) pour n assez grand se trouvent tous proches d’une 


10 


np(1 — p) et/? 


FIGURE 10 - Suites (4x, (fa(tx) — Lo quand p # 1/2 


p—1/2 V2r 
pour diverses valeurs de n et p. 


6) La loi des erreurs. 


Une variable X, de loi binomiale représente le nombre de succès lors d’une suite de n 

épreuves indépendantes avec probabilité de succès p à chaque épreuve. Pour 1 < k < n, 

on note Ÿ, la variable aléatoire égale à 1 si on a un succès à la k-ème épreuve et 0 sinon. On 
nm 

a donc X, = ÿ. Y4. D'autre part, l’espérance commune aux Y4 est m = p, la variance de 
k=1 

Y4 est E(Y?) —-E(Y4)? = m —m? = p(1—p) et l’écart-type de Y4 est donc o = 4/p(1 — p). 

Rappelons le théorème de Moivre-Laplace 


) Yz — nm b 
dt 
a. 


ä V2T 


Le théorème limite central énonce que (3) reste vrai si on suppose que les variables Y} 

sont indépendantes, de même loi, d'espérance m et d’écart-type © fini (on ne définira 

pas l’indépendance de variables aléatoires et on s’appuiera sur l'intuition). On peut donc 

supposer que les Y; suivent une loi uniforme sur {0, 1], ou qu’elles suivent une loi exponen- 
nm 


lim P{a 


im P(a < © <b) = (3) 


tielle. Dans ce cas bien entendu, X, = ÿ° Y, ne suit plus une loi binomiale, mais d’après 


k=1 
la relation (3), les intervalles de fluctuation asymptotiques restent les mêmes. La figure 
nm 
D Yx-nm 
suivante représente les densités f, des variables Z, = = lorsque les variables 
© 


Y4 suivent une loi exponentielle et que n = 4, 16, 35,64 et 100. 


T T T T 1 
53: -2 = 0 1 2 3 


FIGURE 11 —- Comparaison des graphes de f, et de la fonction x — exp (—x?/2)/V27. 


JE 


Le théorème limite central exprime le fait qu’une somme X,, d’un grand nombre de va- 
riables indépendantes, de même loi, et de variance finie a une distribution à peu près 
gaussienne. La loi des erreurs généralise ce fait là à une somme de petites variables 
indépendantes dont aucune n’est prépondérante. C’est en raison de cette universalité 
que les variables aléatoires intervenant en modélisation sont souvent supposées suivre des 
lois normales. Nous allons illustrer ce fait par l’exemple du tireur à la carabine. 


FIGURE 12 — 100 réalisations de (X,Y) où X, Y sont des gaussiennes centrées 
d’écart-type 1, puis d’écart-type 0, 4. 


Observez par exemple la figure ci-dessus. Elle est obtenue en effectuant n réalisations 
de couples (X%,Y4) (1 < k < n) de variables gaussiennes indépendantes centrées. Elle 
correspond bien aux résultats obtenus à un tir à la carabine sur une cible. Expliquons 
pourquoi. Si (X4,Ÿ4) sont les coordonnés du k-ième tir, X% et Y4; sont des sommes de 
petites variables indépendantes (erreur de visée, tremblement, défaut de concentration, 
recul, perturbation par un élément extérieur comme un contrejour ou un eri,...). D’après 
la loi des erreurs, il est donc raisonnable de supposer que (X%,Y4) est un couple de 
variables gaussiennes. De plus, l’indépendance des tirs est exprimée par le fait que les 
couples (X%, Y;) sont indépendants entre eux. Enfin, l’écart-type de ces gaussienne mesure 
l’adresse du tireur : plus il est petit, et plus le tireur est adroiït. 
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Introduction 


Un enseignement qui prend appui sur la résolution de problèmes 


Le programme de l’enseignement de spécialité de la terminale scientifique réintroduit l’algèbre 
linéaire au lycée. Mais l’algèbre linéaire du lycée des années 1980 s’appuyait sur les vecteurs du plan 
et de l’espace, et l’introduction des espaces vectoriels. L’entrée proposée aujourd’hui est matricielle : 
il s’agit de faire jouer un rôle à des tableaux de nombres, lorsqu'ils sont particulièrement adaptés à 
l’écriture et à la résolution de certains problèmes. 


La première partie du présent document présente donc des problèmes où l’introduction des matrices 
vient « naturellement » et apparaît comme une simplification d’écriture et de lecture. Le vocabulaire 
nouveau est introduit en situation. Les définitions et les théorèmes auxquels il est nécessaire de faire 
référence ne sont pas sortis du contexte du problème, au moins dans un premier temps. 


Une petite mise en ordre des notions nouvelles est proposée dans la seconde partie. Des définitions 
convenables et des théorèmes bien rédigés sont en effet indispensables au jalonnement des avancées 
mathématiques. Les professeurs sont invités, conformément à la recommandation du programme, à ne 
pas démarrer directement par la présentation des contenus théoriques exposés dans la seconde partie, 
mais à essayer la démarche proposée consistant à introduire les notions dans le cadre de problèmes à 
résoudre. Cette démarche semble aujourd’hui susceptible d’accrocher des élèves qu’il s’agit de 
conquérir et de convaincre de l’intérêt pour eux de la poursuite d’études scientifiques. 


La base de connaissances introduite en seconde partie permet ensuite une présentation d’autres 
contenus du programme, en se situant de nouveau dans le contexte de problèmes. Ainsi la troisième 
partie développe plus complètement certains thèmes mentionnés comme exemples dans le programme 
et ouvre des perspectives pour aborder d’autres sujets. On y trouvera notamment des connexions 
possibles avec la partie « arithmétique » du programme. 


Des liens vers des ressources sont régulièrement proposés. Il s’agit dans certains cas d’outils 
permettant de se libérer de quelques phases de calcul dont la conduite et l’achèvement éloigneraient 
trop les élèves du problème traité. On doit pouvoir insister le temps qu’il faut sur certains points de 
calcul dont la maîtrise est un réel objectif de l’enseignement, quitte à s’en remettre à d’autres moments 
aux outils dont on dispose aujourd’hui pour pouvoir concentrer l’attention des élèves sur le problème à 
résoudre et les raisonnements nécessaires pour y parvenir. 
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I. Quelques problèmes faisant apparaître des matrices 


Dans cette partie, le vocabulaire spécifique aux matrices et les opérations sur les matrices ne sont pas 
supposés connus. Lorsque la nécessité s’en fait sentir, des matrices sont introduites, sur lesquelles on 
peut faire des opérations (le produit de Cayley notamment, couramment utilisé sous le simple nom de 
produit, et qui est celui proposé par la calculatrice scientifique). La partie II proposera une étude plus 
systématique, mais la recommandation du programme est de commencer par des résolutions de 
problèmes motivant une introduction des matrices et non par une introduction ex nihilo de ces 
dernières et encore moins de l’algèbre linéaire. 


A. Un problème à deux compartiments 
1. Le problème 


On conserve dans une enceinte une population d’êtres unicellulaires qui ne peuvent se trouver que 
dans deux états physiologiques désignés par A et B. On désigne par à, et b, les effectifs — exprimés en 


milliers d’individus — des deux sous-populations (correspondant à chacun des deux états A et B) à 
l’instant n. Des observations menées sur une assez longue période permettent d’estimer que 95% des 
unicellulaires se trouvant à l’instant » dans l’état A n’ont pas changé d’état à l’instant n + 1, non plus 
que 80% de ceux se trouvant à l’instant # dans l’état B ce qui se traduit par le système suivant : 
a, y =0,95a, +0,2b, (+) 
b,., =0,05a, +0,8b, 


L’effectif total s’élève à 500 000 individus. 


1 La population à l’instant 0 satisfait 4, = 375. Faire le calcul des effectifs a, et b, pour 


n < 50. Peut-on faire une conjecture sur le comportement des suites (a, ) et (b,) k 


Effectuer de nouveaux essais en prenant d’autres valeurs initiales (mais un effectif total 
identique). 
2 Quel est le comportement de la suite de terme général &, = a, —400 ? Conclure. 


2. Commentaires sur le problème 


Ce problème a été proposé dans le cadre d’une épreuve pratique de mathématiques. 


Les élèves utilisaient un tableur pour conjecturer la nature des suites (a,) et (b,) . À l’étape 36, si on 


fait abstraction des erreurs de calcul dues au logiciel, le système est stable : il y a 400 000 êtres dans 
l’état A et 100 000 dans l’état B. 


Pour répondre à la question suivante, il suffit de faire entrer dans les calculs le fait que la population 
totale est conservée, autrement dit que, pour tout n : a, +b, = 500. 

a, =0,95a, +0,2b, a, =0,75a, +100 
b,., =0,05a, +0,8b, b,=500-a, 


n+l 
dont les solutions (ce sont des couples de suites) s’obtiennent explicitement en faisant apparaître la 


] 


Le système a les mêmes solutions que le système 


suite (géométrique) de terme général &, = 400-—a,. 
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n a indice # b indice # 
0 375 125 
1 381,25 118,75 
2 385,9375 114,0625 
3 389,453125 110,546875 
4 392,0898438 107,9101563 
5 394,0673828 105,9326172 
6 395,5505371 104,4494629 
7 396,6629028 103,3370972 
8 397,4971771 102,5028229 
9 398,1228828 101,8771172 
10 398,5921621 101,4078379 
11 398,9441216 101,0558784 
12 399,2080912 100,7919088 
13 399,4060684 100,5939316 
14 399,5545513 100,4454487 
31 399,9966516 100,0033484 
32 399,9974887 100,0025113 
33 399,9981165 100,0018835 
34 399,9985874 100,0014126 
35 399,9989405 100,0010595 
36 399,9992054 100,0007946 


3. D’autres façons d’écrire le problème 


On peut schématiser le système de relations (#) par | ) 
n+1 


a 


a 
p( ! | , donnant ainsi 
b, 


une signification au symbole x utilisé ici pour représenter l’action d’un tableau carré (une matrice 
carrée d'ordre 2) sur un couple de réels écrits en colonne (une matrice-colonne). 


Le produit des matrices utilisable sur la calculatrice fonctionne ainsi et on pourrait écrire que, pour 


a, 0,95 0,2)" fa, 
tout entier naturel n non nul, = x ; 
b 0,05 0,8 de 


n 
Cette puissance n-ième de matrice peut-elle s’exprimer explicitement ? 


Cette question n’est pas abordée ici. Notons que des simplifications sont certainement envisageables 
comme le laissent penser les résultats obtenus sur la suite (o1,, ). En effet, si on pose B, =b, 100, on 
a, =0,75"a, 
fr = 
de = 400 — 0,757 x 25 
b, = 100 + 0,757 x 25 


ce qui montre que la répartition de la population des êtres unicellulaires se rapprochera au fil du temps 
de 400 000 individus dans l’état A et de 100 000 individus dans l’état B. 


obtient le système : 


On en déduit que : 
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B. Étude, gestion et prévision économiques 
1. Des tableaux de nombres pour la gestion 


Voici les productions (en milliers) de deux usines de cycles appartenant à une même enseigne pour le 
premier semestre de l’année 2010 : 


Premier semestre 2010 


VTT adultes Vélos enfants VTC BMX Vélos de course 
Usine 1 12,99 13,20 5,58 1,53 1,95 
Usine 2 4,62 4,98 2,16 0,51 0,78 


Si on veut faire entrer les données de ce tableau dans un enchaînement de calcul, on les regroupe dans 
le tableau de nombres suivant : 


12,99 1320 5,384 133, 195 
4,62 4,98 2,16 0,51 0,78 


| , appelé matrice. 


Cette matrice a 2 lignes et 5 colonnes. On dit que cette matrice est de format (2,5). Elle contient 10 
éléments, appelés « coefficients de la matrice ». Pour repérer un coefficient d'une matrice, on indique 
son indice de ligne puis son indice de colonne, les lignes se comptant du haut vers le bas et les 
colonnes de la gauche vers la droite. 


La disposition générale des coefficients de la matrice À est donc la suivante : 


a a a a a 
1 11 12 13 14 15 
d;; dy da da ds 


a; désigne le terme de la 2°" ligne et de la 3°” colonne : 43 = 2,16. 


La production de l’usine 1 pour le premier semestre 2011 peut être représentée par la matrice 
(12,99 13,20 5,58 1,53 1,95 ) appelée « matrice ligne de format (1,5) ». 


12,99 
La production des VTT adultes dans les deux usines est représentée par la matrice | ; } appelée 


> 


« matrice colonne de format (2,1) ». 


Les productions (en milliers) des deux usines de cycles pour le second semestre de l’année 2010 sont les 
suivantes : 


Second semestre 2010 


VTT adultes Vélos enfants VTC BMX Vélos de course 
Usine 1 11,79 15,84 4,38 1,29 1,59 
Usine 2 3,78 4,14 2,40 0,51 0,66 


, ; ; . 11,79 15,84 4,38 1,29 1,59 
Ces données sont représentées par la matrice B = . 


3,78 4,14 2,40 0,57 0,66 
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La matrice C représentant la production annuelle pour ces deux usines est obtenue en ajoutant termes à 
termes les coefficients des deux matrices À et B. La matrice C est, par définition, la somme des 
matrices À et B. On note : C = 4+B. 

Si l’on appelle c;; l’élément de la i-ième ligne et j-ième colonne de la matrice C, on a, pour tout ï égal 
à lou 2 etj comprisentre l'etS: c,, —a,;+b,.. 


24,78 29,04 9,96 2,82 3,54 
8,40 9,12 4,56 1,08 1,44 ) 


On a alors pour tout i égal à 1 ou 2 et j compris entre 1 et 5 : b;, =C;; —4;;. 


Par définition, la matrice B est la différence des matrices Cet 4: B=C-1A. 
Ces opérations sont réalisables sur des matrices de même format. 


La matrice D qui représente la production moyenne par mois dans ces deux usines est obtenue en 
2,065 2,42 0,83 0,235 do 


divisant chacun des coefficients c;. par 12. Ainsi D = 
. 0,7 0,76 0,38 0,09 0,12 


note babe : 
12 


r. 


2. Elaboration d’un indice de prix 


Une association de consommateurs compare les prix de cinq produits p1, Pr, ps, Pa, ps distincts dans 
trois magasins différents. Les observations fournissent les données suivantes : 


Prix des produits à l’unité en euros 


Produit pl Produit p2 Produit p3 Produit p4 Produit p5 
magasin 1 1 5 2 3 4 
magasin 2 1,1 4,7 1,8 3,1 3,8 
magasin 3 0,9 5,1 1,9 3,2 4 


On observe qu'on peut stocker les prix des produits sous la forme d’un tableau à 3 lignes et 5 
colonnes : 


Il 5 2 3 4 


L1 4,7 L8 3,1 3,8 
0,9 5,1 1,9 3,2 4 


On note ce tableau (matrice) À. Pour tout couple d’entiers (i, j) où à est compris entre 1 et 3 et j 
compris entre 1 et 5, le coefficient de la matrice À qui se trouve à l’intersection de la ligne ÿ et de la 
colonne j est noté a, et représente ici le prix unitaire du produit p; dans le magasin i. 


On écrit : A=(a,,). 


Pour comparer la dépense d’une ménagère selon les magasins, on considère un « panier » indiquant 
pour chaque produit la quantité achetée. 
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Un panier est ainsi décrit par la donnée de cinq entiers, par exemple, 2, 1, 3, 3, 2 ce qui signifie que la 
ménagère a acheté deux produits de type 1, un de type 2, trois de type 3, 


Le panier d’une ménagère peut donc être représenté sous la forme d’un tableau à 5 lignes et 1 
colonne : 


gs 
Le prix 77 d’un panier dans chacun des 3 magasins se calcule alors de la façon suivante : 
14=qx1+qgx5+g;x2+qax3+gqsx4=Q;Xx 41 + Q2X A2 + Q3X 13 + Ga X Aya + 5 X A5 
1B= qiX 4n + Q2X An + q3X G3 + Qa X Guy + G5 X Q5 
1B= qiX 43 + Q2X 432 + q3X 33 + Qa X 34 + Q5 X Q35 


On peut traduire les relations précédentes par l’égalité matricielle suivante : 


qi 
IX 11 12 13 ia Ai5\ | Q2 
IL | = | G21 22 23 24 25 || 3 
I A31 32 33 25 A35/ | da 
VE 
ce qui définit le produit de la matrice À par la matrice colonne ©. Dans notre exemple : 
2 
30 LL 9, 2 3 4 1 
(2) = (52 4,7 1,8 3,1 18) , 
30,2 09 Si 19 32 % 3 
2 


3. Gestion des admissions et sorties dans un hôpital 


On estime que les patients admis dans un certain service d’un hôpital peuvent se trouver dans l’un des 
4 états suivants : 1. Soins réguliers, 2. Chirurgie, 3. Soins intensifs, 4. Sortie. 


Cette estimation est décrite par le tableau suivant, dans lequel sont indiquées les probabilités de 
passage d’un des états à un autre dans un intervalle de 24 heures (probabilités obtenues par 
modélisation des fréquences observées sur une longue période). 


Tableau de circulation des malades entre les services : 


1. Soins réguliers 2. Chirurgie 3. Soins intensifs 4. Sortie 
1. Soins réguliers 0,6 0,2 0 0,2 
2. Chirurgie 0,1 0 0,8 0,1 
3. Soins intensifs 0,5 0 0,33 0,17 
4. Sortie 0 0 0 0 
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Ce tableau se lit de la manière suivante : un malade se trouvant un jour en soins réguliers a la 
probabilité 0,6 de se trouver le lendemain en soins réguliers, 0,2 de se trouver en chirurgie, une 
probabilité nulle de se trouver en soins intensifs et la probabilité 0,2 de sortir etc. 


Les informations chiffrées précédentes peuvent être stockées sous la forme d’un tableau (matrice) à 4 
lignes et 4 colonnes : 


0,6 0,2 0 0,2 
C[OI 0 08 01 
[0,5 0 0,33 0,17 

0 0 O0  o 


Supposons qu’un certain jour, la distribution des patients suivant les quatre états possibles s’écrive 
X = (12 5 6 3). Le lendemain, la nouvelle distribution X"— (m m, M; m, )des nombres 


de malades par état d’hospitalisation (les m; ) est obtenue grâce au système suivant : 


m =12x0,6+5x0,1+6x0,5+3x0 
m, =12Xx0,2+5x0+6x0+3x0 
m, =12xX0+5x0,8+6x0,33+3x0 
m,=12X0,2+5x0,1+6x0,17+3x0 
qui donne X'= (10,7 2,4 6 30) 
Ce résultat (dans lequel on ne doit pas se formaliser de trouver des dixièmes d’êtres humains) peut se 
traduire par l’égalité matricielle suivante : 
0,6 0,2 O0 0,2 
0,1 0 0,8  O,1 
0,5 0 0,33 0,17 
0 0 0 0 


Supposons qu’au jour 0, dix patients soient admis en soins réguliers et qu’il n’y ait aucun patient en 
cours de traitement. On note X, — (10 0 O0 0) la répartition des malades le jour 0 et X; la répartition 
des malades au 4°” jour, k entier positif. 


X'=XM=(12 5 6 3) 


Supposons également que 10 patients soient admis chaque jour. 
Le processus se déroule de la manière suivante : 


X,=(10 0 O0 O)M+(10 0 O0 0) 
X,=XM#+(10 0 O0 O)=XM°+XM+X, 
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Les calculs confiés à un tableur montrent que la situation tend à se stabiliser. 


Jour soins réguliers chirurgie soins intensifs sortie 

10 0 0 0 
1 16 2 0 2 
2 19,8 3,2 1,6 3,4 
3 23 3,96 3,093333 4,546666 
4 25,742666 4,6 4,199111 5,511555 
5 28,005155 5,148533 5,079703 6,308385 
6 29,857798 5,601031 5,812061 6,962501 
7 31,380812 5,971559 6,418178 7,500339 
8 32,634732 6,276162 6,916640 7,943014 
9 33,666776 6,526946 7,326476 8,307336 
10 34,5159989 6,733355 7,6637162 8,607129 
19 37,778916 7,526399 8,959652 9,759018 
20 37,899815 7,555783 9,007670 9,801698 
21 37,999302 7,579963 9,047183 9,836819 
22 38,081169 7,599860 9,079698 9,865720 
23 38,148537 7,616233 9,106454 9,889503 
24 38,203972 7,629707 9,128472 9,909073 
25 38,249590 7,640794 9,146589 9,925177 
26 38,287128 7,649911 9,161498 9,938429 
27 38,318018 7,657425 9,173767 9,949334 
28 38,343437 7,663603 9,183863 9,958307 


On pourrait continuer le calcul littéral précédent, pour aboutir à l’égalité suivante. 


.+ M + M +D),, où J désigne la 
matrice identité d’ordre 4 (de format (4,4), dont les coefficients sont tous nuls sauf sur la diagonale 


Pour tout nr entier supérieur ou égal à 2, X, = Xo (M"+M" 1 


principale où ils sont tous égaux à 1). 
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C. Le modèle d’urnes de T. & P. Ehrenfest 


1. Présentation du problème 


Ce modèle simplifié de diffusion d’un gaz à travers une membrane poreuse fut proposé en 1907 par les 
physiciens autrichiens Tatiana et Paul Ehrenfest pour décrire en termes de physique statistique les 
échanges de chaleur entre deux systèmes portés initialement à une température différente. Il permit 
ainsi de mieux comprendre le phénomène thermodynamique et de lever un paradoxe : 


o d’un point de vue macroscopique, un système thermodynamique évolue naturellement et 
irréversiblement de façon que son entropie (quotient de la variation de chaleur par la 
température) soit maximum, 


o mais d’un point de vue microscopique, on peut remarquer que les mouvements des particules 
sont réversibles. 
Le but est de modéliser la répartition au cours du temps de N molécules de gaz à l’intérieur d’un 
récipient divisé en deux compartiments séparés par une membrane poreuse. 


État initial État à l'étape k 
Description du modèle : 
On modélise mathématiquement par l’expérience aléatoire suivante. 
On considère 2 urnes A et B, et N boules numérotées de 1 a N. 


Initialement, toutes les boules se trouvent dans l'urne A. Ensuite, aux étapes 1, 2, 3,... on tire au 
hasard, de façon équiprobable, un nombre entre 1 et N, et on change d’urne la boule correspondante. 


2. Étude du cas N =2 


A chaque étape, la répartition dans les urnes A et B est l’une des trois suivantes : 


M 1 e Le er ee 


urne À urne B urne À urne B urne À urne B 


Répartition r: Répartition r2 Répartition r; 
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a) Introduction d’une matrice 
Notons : R;, l’événement « la répartition est r1 » ; 
R; l’événement « la répartition est 7; » ; 


R; l’événement « la répartition est r; ». 


ñ r, 73 
1 
1 2 
ANSE 
7 


En notant, pour tout i et j de {1,2, 3}; p,;, = pa (R,) , On à alors : 


il il 
Po = LP 7 2°P2 7 3°Ps =letp,, = pp = P33 = Pis = Pa = 0 
Ces données peuvent être stockées sous la forme d’un tableau (matrice carrée de format (3,3)) : 
1 O0 
Pi Po Pi 
P = : 0 : 
Pa Px2 Px 2 2 
Pa Py Psy 0 1 0 


Soit £ un nombre entier naturel non nul. On note Y, la variable aléatoire égale au nombre de boules 
dans l’urne B à l’instant £ > 0. On a bien sûr X, — 0 et pour tout entier k > 0,X4 € {0,1,2} 
Notons : 44 l’événement « à l’étape k, la répartition est 7 », autrement dit « 44 = 0 » ; 

B} l'événement « à l’étape k, la répartition est r », autrement dit « X4= 1 »; 


Cx l'événement « à l'étape £, la répartition est r3 », autrement dit « X,= 2 ». 
On a alors: p(4,,)=p(A4NA4;)+p(4unB,)+p(A4inC;) 
= p(A)pa, (Ara)+ P(Ba) Ps, (Aua)+ P(Ci)pe, (Au): 
Or pa, (Ara)= Par Pr, (Axa)= Pa € Pc, (Axa)= Pa: 
D'où: p(4,,)=pap(4;)+pap(B;)+pup(C;). 
On établit des relations analogues pour p (B4u) et p (Cr). On obtient finalement le système suivant : 
P(Ara)= Pap(A:)+ PaP(B,)+ pap(Ci) 
P(By4)= PaP(Ax)+ PHP(B:)+ PHP(C) 
P(Cra)= PsP(A4)+ PP(B:)+ PHP(C 4) 


En notant V, = (p(Ai) p(B) p(Ci)) pour tout entier k strictement positif, le système de relations 
précédent correspond à l’égalité matricielle Vx:1 = V4P. 


A l’étape initiale, la répartition est r1, donc V5 = (1 0 O). 


A l'issue de la première étape, la répartition est 7, et V1 = V5P =(0 1 0). 
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On établit par récurrence que : 


o pour tout entier naturel X non nul : V, = V,P* 


Il Il 
2 ° 2 
o P*=pP=|0 1 O!|etque P**"=P pourtoutentier #>1. 
Il 
Ro 
2 2 


On en déduit facilement que : 


o pour tout entier k impair, V;= (0 1 0), ce qui correspond au fait qu’à tout instant impair, 
la répartition est toujours 72 


: ; 1 
o pour tout entier Æ pair, non nul, V4 = É 


1 à M 0 : 
= 0 5) , Ce qui correspond au fait qu’à tout instant 
pair, la répartition est soit r, soit r3. 


Le calcul de l’espérance de X, conduit à E(X,)=1, pour tout entier naturel #, ce qui signifie qu’au 


bout de £ étapes, le nombre moyen de boules dans l’urne B est égal à 1. La répartition des boules dans 
les deux urnes a tendance à s’équilibrer. 


b) Utilisation d’un arbre 


étape 1 étape 2 étape 3 étape 4 étape 5 étape 6 


A la K°"% étape, on obtient les arbres suivants : 


Si est impair | Si k est pair 

ñ a RL r or ñ 
1 E 

nn | 2ùz 


On retrouve alors les résultats du paragraphe précédent. 


Remarque : 


Le recours au calcul matriciel n’est vraiment utile que pour un grand nombre de particules maïs le cas 
où N = 2 permet d’appréhender le problème en expliquant l’utilisation des matrices et en comparant 
les résultats obtenus avec ceux que l’on obtient avec l’utilisation d’un arbre. 
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c) Calcul du temps de retour moyen dans le cas N = 2 


Considérons un processus de diffusion correspondant à 2n étapes et notons 7, la variable aléatoire qui 
compte le nombre d’étapes pour revenir à l’état initial. 


D’après l'étude précédente, on a : 
P(T, = 1)= 0 ,P(T, =3)= 0 et, pour tout entier naturel 4, p{T, =2k+1) =0 ; 


Il 


p(L,=2)= PT =4)= : et, pour tout entier naturel & non nul, p(T, =2k)= 


Calculons l’espérance de T, : 


2n 


1,)= LRP(, =k)= D 2kp(. = 24) = Te 


Calculons cette somme de deux façons différentes. 


o Première méthode 


On calcule successivement les sommes géométriques : 


1  ] 
Dans À DE Pr 


k=n-1 


En ajoutant ces sommes, on obtient : 


E(T)=4- cie 


o Deuxième méthode 
x! 
On considère la fonction définie sur R par f(x) = D+ . On peut également écrire : 
k= 1 2 


n+ 
X 


f@= Re et f(2)=n. 


+ 
2 


Pour x+2, les deux expressions de f(x) permettent d’exprimer f'(x) de deux façons différentes. 
On obtient alors deux expressions de f'(1), ce qui permet de calculer E(T,). 


On en déduit que Jim E (T .)= 4. On revient donc en moyenne à l’état initial au bout de 4 étapes. 


Remarque : 


Il est intéressant de constater que si N — 2, le processus est réversible. 


Cette étude est reprise et complétée dans la partie HI. 
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D. Représentation d’un graphe. Notion de connexité 
1. Parcourir un graphe 


Chacun connaît l’histoire du parcours impossible empruntant une et une seule fois les sept ponts de la 
ville de Koenigsberg (aujourd’hui Kaliningrad), ponts reliant les rives (B et D) du fleuve qui traverse la 
ville, la Pregel, aux deux îles (A et C) que celle-ci forme, et les deux îles entre elles. 


On dit que Léonard Euler (1707 — 1783) résolut le problème et mit en évidence l’absence de solution. 
L’humanité l’avait résolu en pratique avant lui, mais le génie d’Euler fut de fabriquer des mathématiques 
avec cette question, c’est-à-dire de donner des définitions donnant naissance à des théorèmes 
réutilisables dans d’autres situations. 


D 


Les ponts de Koenigsberg 


Le problème des ponts de Koenigsberg consiste en fait à savoir si un certain graphe est eulérien (c’est- 
à-dire si on peut en parcourir toutes les arêtes sans passer deux fois sur la même). 


Voici quelques définitions. 


Un graphe (non orienté) à n sommets est une suite finie de points distincts (M1, M5, ..., M,), appelés 
sommets, et d’arêtes, dont les extrémités sont des sommets. On considérera ici qu’il n’existe pas de 
boucle, c'est-à-dire d’arête ayant pour extrémités le même sommet, et qu’il n’existe pas non plus de 
point isolé, c'est-à-dire relié à aucun autre point. 


Une chaîne de longueur p > 2 reliant M; à M; est une suite de sommets (s,,5,,...,8 D. Lu) telle que 


Sy, =M;, Sy = M;, et que, pour tout entier À compris entre 1 et p, il existe une arête reliant S4 à Sz:1. 
Dans le graphe associé au problème des Ponts de Koenigsberg, il n’existe pas de chaîne de longueur 1 
reliant B à D. 


Dans le graphe ci-dessous, (Ms, M:, M)) est une chaîne de longueur 2 reliant Ms à M, (Ms, M4, Mb, 
M) en est une de longueur 3, (Ms, Ms, M4, Mb) une de longueur 4, etc. 


Un graphe en forme d’« enveloppe » 


Il n’existe pas de chaîne de longueur 1 reliant Ms à lui-même, mais il en existe une de longueur 2 : 
(M, M, M). D'ailleurs, quand le graphe ne contient pas de point isolé (ce qui est notre hypothèse de 
travail), il existe toujours une chaîne reliant un point à lui-même. 


Un graphe est dit connexe quand, deux points quelconques étant donnés, il existe une chaîne qui les relie. 
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2. Matrice d’adjacence d’un graphe 


Un graphe à n sommets est caractérisé par les arêtes qui relient certains sommets entre eux. On peut donc 
représenter un graphe à # sommets (M;, M, …, M,) par un tableau à n lignes et ñ colonnes dans lequel, à 
l'intersection de la ligne ; et de la colonne j, on écrit 0 si aucune arête ne relie M; et M, et 1 si une arête 
les relie. Aïnsi pour le graphe précédent (« l’enveloppe »), on obtient le tableau suivant : 


M1 M2 M3 M4 M5 M6 
M1 0 1 0 0 1 0 
M2 1 0 1 0 1 Il 
M3 0 il 0 Il 0 Il 
M4 0 0 1 0 1 il 
M5 il Il 0 Il 0 il 
M6 0 1 1 1 1 0 


En notant a;;le coefficient situé à l’intersection de la ligne z et de la colonne , on définit un tableau à 6 
lignes et 6 colonnes (matrice de format (6, 6)), appelée matrice d’adjacence du graphe : 


0 1 0 O0 1 0 
ioio:: 

4=|0 L 0 1 01 

0 0 1 0 1 1 

1 1 Di di 

0 1 1 1 1 0 


La matrice précédente contient de nombreux Zéros, traduisant l’absence d’arêtes reliant certains 
sommets du graphe. Par exemple, à la lecture de la matrice, on peut dire qu’il n’y a pas d’arête reliant 
les sommets M; et M4. 


Afin d’étudier la connexité d’un graphe, on peut s’intéresser à l’existence de chaines de longueur 2 
entre deux sommets. 


Soient i et j deux entiers compris entre 1 et n (ici n — 6). L’existence d’une chaine de longueur 2 entre 
les sommets M; et M; correspond à l’existence d’au moins un indice k tel que a;;# 0 et az; # 0 c’est-à- 
dire tel que a;; ax; # 0. 


On observe alors que le nombre b;; my aixaxj est la somme de six termes dont chacun est le 
produit de deux nombres choisis parmi 0 et 1 ; à chacun des termes non nuls de cette somme est 
associée une chaîne de longueur 2 joignant M; et M; et une seule. Leur somme est donc le nombre de 
chaînes de longueur 2 joignant M; et M,. 


Les coefficients b; ; définissent une nouvelle matrice B et les n° relations précédentes peuvent se 
traduire par la relation matricielle suivante : 


Fe be he Da Me be 
bs1 Dbs2 bs3 bsa bss bse 
b6e1 Dez Des Déa Des b66 
Gi1 12 13 14 15 Me di1 12 13 14 is 6 
G21 22 23 24 25 A6 A21 22 23 24 25 6 
| 31 32 33 Usa 35 36 à G31 32 33 34 35 36 | _ A2 
Aa 42 43 ya as 46 Ay1 42 43 ya as U46 
ds1 52 53 Usa ss G56 ds1 52 53 Usa 55 56 
dei oz 63 ca 65 Gé doi 62 63 ca es 66 
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qui définit le produit de la matrice À par elle-même. 


Numériquement, la relation s’écrit ici : 


0. 1 0 0 1 0 0 1 O0 0 1 0 2, À 4 EL £ 
110 1 0 1 1 1 0 1 0 1 1 1 #4 1 3 2 2 
0 1 0 À 0 LEO 1 0 £ 0 LILIL 1 3 1 3 2 
0 0 1 0 1 1 0 0 1 0 1 1 LS E SUL Z 
1 1 0 1 0 1 1 1 0 1 O0 1 123142 
Ou LT + E 0 0 1 1 1 1 O0 2 2 2 2 2 4 


On peut ainsi lire dans la matrice de droite qu’il y a 3 chaînes de longueur 2 joignant le sommet M; au 
sommet Ms. 


On peut ensuite définir les puissances successives de la matrice d’adjacence À et montrer par 
récurrence que, pour tout entier p > 1, les coefficients de la matrice 4° donnent les nombres de chaînes 
de longueur p allant d’un sommet du graphe à un autre. 


3. Lire la connexité d’un graphe sur sa matrice d’adjacence 


Le calcul numérique précédent a pour résultat une matrice B dont aucun coefficient n’est nul, ce qui 
signifie que chaque fois qu’on se donne deux sommets, il existe une chaîne de longueur 2 qui les relie. 
On peut donc conclure que le graphe de l’« enveloppe » est connexe. 


Cela pouvait, bien sûr, se voir mais il faut imaginer des graphes possédant un grand nombre de 
sommets où « voir » n’est plus aussi évident. 


Ce qui précède montre surtout qu’un graphe peut être donné par sa matrice. 


En consultant les puissances successives de la matrice d’adjacence, on peut savoir s’il y a des chaînes 
de longueur 2, 3, ... reliant tel sommet à tel autre. Mais jusqu’où calculer pour établir la connexité 
d’un graphe dans un cas quelconque ? 


Considérons un graphe à n sommets (7 > 2). Si une chaîne de longueur n ne passe pas par tous les 
sommets du graphe, alors elle passe au moins deux fois par le même sommet et on peut réduire la 
«boucle » qu’elle formait. Cet argument montre que pour étudier la connexité, il suffit de pousser la 
recherche jusqu’à la puissance n-ième. D’où le résultat suivant : 


un graphe associé à une matrice d’adjacence À de format (n, n) (on dit aussi matrice carrée d’ordre n) 
est connexe si et seulement si, pour tout couple (5, j) d’entiers compris entre 1 et n, il existe un entier p 
compris entre 1 et n tel que le coefficient de la ligne ; et de la colonne } de la matrice 4° soit non nul. 


E. Marches aléatoires 


Dans cette partie, on s’intéresse au comportement à long terme d’une marche aléatoire. Il s’agit de 
calculer les probabilités pour le héros d’une marche aléatoire dans un réseau de se trouver après n pas 
en tel ou tel sommet (ou nœud) du réseau. 


1. Marche aléatoire sur un segment 


Le personnage se déplace d’un sommet à l’autre du graphe ci-dessous. S’il est en A ou en B, il ne peut 
aller qu’en P, s’il est en P, il peut aller en À ou en B avec des probabilités que nous considérons 
comme identiques. 


On peut représenter la situation par une matrice M (dite de transition) qui indique non les arêtes 
existantes comme dans les matrices d’adjacence, mais les probabilités de passage d’un sommet à un 
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autre. Les matrices de transition ne sont pas systématiquement symétriques. La matrice M ci-dessous 
représente la marche dans le réseau (A, P, B). 


A P B 
p 
P|— 0 — 
B |? 2 

0 1 0 


Les coefficients figurant sur chaque ligne donnent les probabilités de passage du sommet qui donne son 
nom à la ligne à celui qui donne son nom à la colonne. La diagonale ne contient de ce fait que des 0. 


Pour aller de A à A en deux pas, le personnage peut aller de A à A puis de A à A (les probabilités sont 
0 et 0), ou de A à P puis de P à A (probabilités 1 et 2), ou de A à B puis de B à A (probabilités 0 et 0). 


Il 1 
La probabilité pour qu’il aille de A à A en deux pas est donc : 0OxO+1x à +0x0 = à 


Pour aller de A à B en deux pas, le personnage peut aller de A à A puis de A à B (probabilités 0 et 0), 
ou de À à P puis de P à B (probabilités 1 et 2), ou de A à B et de B à B (probabilités 0 et 0). La 


| 1 
probabilité pour qu’il aille de A à B en deux pas est donc : OxXO+1x n +0x0 = — 


La première probabilité s’obtient en additionnant terme à terme les produits des coefficients de la ligne 
correspondant aux déplacements partant de A par ceux de la colonne correspondant aux déplacements 
arrivant en À. 


La seconde s’obtient en faisant la somme des produits terme à terme des coefficients de la « ligne A » 
par ceux de la « colonne B ». 


En itérant le procédé on obtient la probabilité de chacun des trajets de deux pas. Cela revient à calculer 
le produit de la matrice précédente (notée M) par elle-même, c’est-à-dire la matrice M ?. Les 
coefficients qui figurent dans cette matrice M° sont les probabilités pour que le personnage situé au 
sommet qui donne son nom à la colonne se soit trouvé deux coups auparavant au sommet qui donne 
son nom à la ligne. 


On obtient : 
1 | 
0 1 0 = 0 = 0 1 0 
1 1 > _|2 2 sf 1 
M=|- 0 -}, M‘=|0 0 et M°=|- 0 —- 
2 2 1 1 2 2 
0 0 = 0 — 0 1 0 
2 2 


On constate que M° = M. 
On peut interpréter ce résultat : par exemple, partant du sommet A, le personnage est sûrement en P 


après un nombre impair de pas, en B ou en A avec des probabilités 2 après un nombre pair de pas. 
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2. Marche aléatoire aux sommets d’un tétraèdre 


A 


C 


À la différence de la situation précédente, dans la marche aux sommets d’un triangle comme dans la 
marche aux sommets d’un tétraèdre, on peut passer, à chaque étape, de tout sommet donné à tout autre 


sommet donné. 


Dans l’hypothèse d’équiprobabilité, la matrice de transition (donnant les probabilités de passage d’un 


sommet à un autre) s’écrit : 


[=] 


CRE œ | Lg | 


© | 


1 
3 
1 
3 


Se | 


1 
3 
1 
3 
1 
JL 


[=] 


On peut démontrer par récurrence que, pour tout entier n strictement positif, la puissance n° de la 


matrice M s’écrit : 


où les termes généraux des suites (u,) et (r, ) sont : u, — à 1-[ 


La lecture de ces matrices de transition est naturellement la même qu’au paragraphe précédent : le 
coefficient générique — celui situé sur la ligne ; et la colonne j — de la matrice M" donne la probabilité 
qu’une chaîne de longueur # permette de passer du sommet z au sommet / (on peut supposer que les 
sommets À, B, C, D sont numérotés 1, 2, 3, 4). Il n’y a pas d’ambiguïté dans ce cas, la matrice est 


symétrique (les puissances d’une matrice symétrique sont symétriques). 


Les différences entre les différentes probabilités s’estompent rapidement : s’il n’est pas possible de 
passer d’un sommet à lui-même en un pas, les probabilités d’aller d’un sommet quelconque à un 
sommet quelconque sont très voisines dès que #1 est grand. En effet, la limite commune des deux suites 


jap) " 
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3. Un retour en arrière est-il possible ? 


Ayant quitté un sommet du tétraèdre, au bout de combien de pas aléatoires le personnage peut-il 
compter y revenir ? 


Soit X la variable aléatoire donnant, pour chaque marche, ce nombre de pas. 


On a: P(X = 1) = 0, P(X=2) =, P(X=3) =. En effet, pour que le personnage soit en A, 


par exemple, après n pas sans y avoir été dans aucune de ses positions précédentes, il est nécessaire 
qu’à chacun de ses déplacements précédents il soit passé d’un sommet qui n’était pas A à un autre qui 
n’était pas À non plus, choisissant donc l’un de deux sommets sur trois possibles. 
2 n—2 
On peut vérifier par récurrence que P(X L n) L F3) x 3° pour tout entier n supérieur ou égal à 2 
et observer que : n 
im D P&=E = 1 
n— 0 
k=2 
La variable X suit donc une loi géométrique. 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/marche/marchel.js 


http://euler.ac-versailles.fr/wm3/pi2/marche/marche2.jsp 


http://euler.ac-versailles.fr/wm3/pi2/marche/marche3.jsp 


http://euler.ac-versailles.fr/wm3/pi2/marche/marche4.jsp 


F. Pertinence d’une page web 
1. De la recherche dans une bibliothèque à la recherche dans un graphe 


Un moteur de recherche doit fournir à chaque utilisateur une liste de pages où apparaissent des mots-clés 
donnés dans la requête de celui-ci. On peut avoir l’idée de classer les milliards de pages disponibles dans 
un ordre permettant le tri à partir des mots-clés fournis. Cela demande des moyens de stockage 
considérables et la réorganisation continuelle (en temps réel, comme on dit) de ces archives. Il faut de 
plus assurer aux milliers de requêtes simultanées des réponses rapides, mais aussi des réponses fiables. 


Un moteur de recherche copie dans un premier temps les pages web sur des milliers d’ordinateurs et 
les trie par ordre alphabétique des mots clés. La première idée simple consisterait pour chaque requête 
à fournir la liste de pages contenant le (ou les) mots clés de la requête. Mais il y en a des dizaines de 
milliers ! Aussi l’ordre alphabétique n’apparaît pas le meilleur pour assurer un service rapide et de 
qualité. Les pages référencées pour le client doivent donner une idée aussi juste que possible de 
l'information disponible au moment de la requête et faire apparaître en premières citations celles qui y 
répondent le mieux, les plus pertinentes. 


Le web n’est pas une simple bibliothèque de pages web. Les pages web comportent des liens qui 
permettent d’accéder directement de l’une à d’autres. On peut donc considérer le web comme un 
graphe orienté, dont chaque page web est un sommet et chaque lien est un arc. L’idée pour déterminer 
la pertinence d’une page en lien avec un mot clé va être de s’appuyer sur l’existence de ces liens, en 
partant de l’idée basique que plus une page est citée, plus elle est pertinente. 


Dans la suite, les pages web sont numérotées 1, 2, ..., i, ..., n et un lien de la page à vers la page j est 
noté i — j. 


Ainsi on cherche à attribuer à chacune des pages une mesure de pertinence (un nombre réel > O). 
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2. Un exemple 


Pour la suite, nous allons considérer un exemple excessivement simple avec seulement 12 pages web 
et les liens suivants : 


11 10 


Le graphe ci-dessus, qui ne comporte pourtant que 12 sommets, n’est pas très lisible. Les sommets les 
plus « fréquentés » n’y sont pas facilement identifiables. 


5 


Une nouvelle représentation de ce graphe, plus « buissonnante » à défaut d’être arborescente, met 
mieux en évidence l’importance des sommets 1, 6 et 10, vers lesquels « pointent » un nombre élevé 
d’autres sommets. 


3. Mesurer la pertinence 


Dans ce qui suit, on note u; la mesure de pertinence de la page j, pour tout entier j compris entre 1 et n, 
nombre de pages web disponibles à l’instant considéré, en rapport avec la requête considérée. 


o  Comptage naturel des liens 


A chaque page j, on associe le nombre de liens i — j qui pointent vers elle. 


Dans notre exemple, les pages 6 et 10 reçoivent chacune 3 liens, tandis que la page 1 en reçoit 5. On 
obtient donc : u5 = 3, 0 = 3 et y = 5. 


Mais ce comptage n’est pas suffisamment discriminant et il est de plus très facile à manipuler, 
puisqu'il suffit de créer des « fausses » pages pointant vers la page i pour en augmenter l’importance. 
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o  Comptage pondéré 


On peut tenter de pondérer les liens : certaines pages émettent beaucoup de liens ce qui d’une certaine 
façon diminue leur poids. 


Notons, pour chaque entier i, À; le nombre de liens émis par la page i. 


On peut alors définir la mesure de pertinence de la page j en comptant le nombre de liens pondérés qui 


pointent vers elle : 
y l 


i=j 
Dans notre exemple, u5 = 1,45, 30 = 1,5 et uy = 2,5. 
Mais cette mesure présente toujours le même risque d’être manipulée. 
o  Comptage récursif 


La pertinence d’une page est renforcée par la pertinence des pages qui pointent vers elle et elle est 
diminuée par la dispersion éventuelle des liens issus de ces dernières. 


En reprenant la pondération précédente, on peut définir la pertinence d’une page j de la façon suivante : 
: 1 
LH 1 >. Fra () 
1] 


Le risque de manipulation consistant en l’ajout de pages vides de sens est ici annulé puisqu’une telle 
page recevrait une mesure de pertinence nulle. 


Avec le graphe présenté dans le paragraphe précédent, on obtient par exemple : 


l 1 
# 7346 Ho — Hi +3 Ho etc. 


On obtient ainsi un système d’équations linéaires. 


On réécrit les formules (*) pour tout entier i compris entre 1 et r avec des coefficients notés a; le 


coefficient a;; valant = si la page 1 pointe vers la page j, 0 sinon. On obtient ainsi le système linéaire 
i 
de n équations à n inconnues (les y;). : 


n 


4j= ) ak 1<j<n 
i=1 


Les coefficients a; ,; définissent une matrice à n lignes et n colonnes (de format (n, n)), que l’on peut 
noter À. 


Le système linéaire de 7 équations précédent correspond à l’équation matricielle suivante : 
W = WA, 
où W est une matrice ligne à n colonnes (format (1, n), dont les coefficients sont les u; : 
W= (ur 12. Un) 
«Il n’y a plus qu’à » résoudre ce système, sauf que dans le cas du web il y a des milliards 


d’inconnues. Dans notre exemple, on obtient une matrice de format (12,12). 
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4. Pertinence et probabilités 


Dans le système d'équations (; = Yi-1 dj; ,1 <j <n) précédent, on peut remarquer la propriété 
suivante des coefficients a;; : 


di; —= 
j=1 


En fait, pour un indice i fixé (c'est-à-dire dans la ligne i de la matrice) tous les coefficients non nuls 
sont égaux à l’inverse du nombre de liens émis par la page i, ce nombre correspondant également de 
ce fait à l’inverse du nombre de coefficients non nuls de la ligne i. 


Les coefficients a; ; (tous positifs ou nuls) peuvent donc s’interpréter comme la probabilité, pour un 
« surfeur » qui se trouverait à la page 1 de suivre le lien qui l’amènerait à la page j. Cette probabilité 
est définie de la manière suivante : si 1; liens sont issus de la page i, la probabilité pour que le surfeur 
aléatoire du web passe de la page i à une des pages vers lesquelles elle pointe est =: , la probabilité 
pour qu’il se dirige vers une autre est 0. A 


Notons X, la variable aléatoire indiquant la position (numéro de page) du surfeur aléatoire après p 
clics. On a: 


P(X,#1 =j) = D Phe=pet = j).P(X, = i) = > aÿP(Xy = i) 
i=1 i=1 


En notant U, la matrice ligne à n colonnes admettant P(X, = i) pour coefficient à la colonne : pour tout 
entier À compris entre 1 et n, les relations précédentes peuvent se traduire par la relation matricielle 
suivante : 

Un = U,4 


On en déduit par récurrence que, pour tout entier p strictement positif, U, = U,4?, avec U, donnant la 
position du surfeur aléatoire au départ (U, est donc une matrice ligne à n éléments tous nuls sauf un 
qui vaut 1 et dont l’indice correspond au numéro de la page de départ). 


Toutefois, il peut arriver que certaines pages ne comportent aucun lien vers d’autres pages ; dans ce 
cas, lorsque le surfeur aléatoire arrive sur l’une d’entre elles, il lui est impossible de la quitter. La ligne 
de la matrice correspondant à cette page ne comporte alors que des 0. Afin de remédier à ce défaut et 
sans doute coller mieux à la réalité, on introduit la possibilité de quitter à tout instant une page 
quelconque pour se diriger vers une autre choisie au hasard, et ce avec une probabilité égale à c. 


Dans ces conditions, le modèle correspond au système de relations suivant pour tout entier p 


: . —— ; : j=n : 
strictement positif et tout entier i compris entre 1 et n (puisque Ein P(Xy = j) =D : 


” C . 0 0 = C 0 
P(Xou = j) = + (1 D) Piel =0) =)C + (a). P(X, = 
i=1 i=1 
qui se traduit par la relation matricielle suivante (pour tout entier p > 0) : 


Un+1 = Un [y +(1-c)A] 


où / désigne la matrice carrée de format (n, n) dont tous les coefficients sont égaux à 1. 
Notons B = | +(1—0)A. 


On a alors, pour tout entier p strictement positif, U, = UoB?. 
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Il resterait à prouver que la suite de matrice (B?) converge (dans un sens à préciser) lorsque l’entier p 
tend vers l’infini et expliquer comment récupérer les mesures de pertinence 47, Lu, …, Un. 


Il n’est pas question de traiter ici le cas général. Nous allons nous contenter d’observer ce qui se passe 
sur un exemple élémentaire. 


Dans l’exemple ci-dessous, le graphe représente les liens existant entre quatre pages web numérotées 
de 1 à 4 (M;, M, M3, Mi) ; 


Mi 


M; 


La matrice À associée à ce graphe, telle que définie dans le paragraphe précédent, est : 


DIRONIR © 

Oo © © win 
DIRONIRWIR 
OO hr © win 


On observe ici que la matrice n’est pas symétrique contrairement à la matrice d’adjacence définie dans 
la partie d. Cela tient au fait qu’ici le graphe est orienté. 


On peut montrer que les puissances de la matrice À ont pour limite la matrice L ci-dessous. On a alors, 
Il it la situati initiale Us UoL = ( + >) 
quelle que soit la situation initiale Uo,Uo 5 3 & 1. 


4 5 
, , et : 
13 13 13 13 


En conséquence, on attribue aux pages 1, 2, 3, 4 les indices de pertinence respectifs 


L = 
3 1 4 5 
13 13 13 13 
3 1 4 5 
13 13 13 13 
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Dans le deuxième modèle, avec c = 1 / 5, on obtient la matrice : 


1 19 19 19 

20 60 60 60 

9 1 9 1 

_ 1 4 _|20 20 20 20 
B=5/+54=| "1 1 1 17 
20 20 20 20 

9 19 1 

20 20 20 20 


On démontre que les puissances de la matrice B conduisent à une matrice limite et à des indices de 


135 323 171 ,,1007 
572’ 2860’ 572 2860 


pertinence qui sont , à comparer aux indices trouvés précédemment. 


Page 1 2 3 4 
Sans saut aléatoire 0,23 0,08 0,31 0,38 
Avec saut aléatoire 0,24 0,11 0,3 0,35 


Ressource : http://euler.ac-versailles.fr/wm3/pi2/pertinence/pertinence.jsp 


G. Traitement de l’image 
1. Numériser des images. imager les nombres 


On a extrait l’image ci-contre d’une photographie d’Alan Turing disputant 
une course de 3 miles en 1946. Cette photographie a été reproduite sur un 
site web consacré à l’un des « inventeurs » de l’informatique dont l’adresse 
est donnée ci-dessous. Elle a donc été «numérisée », c’est-à-dire 
transformée en une suite de 0 et de 1. Le rectangle est décomposé en un 
certain nombre de petits carrés, et à chacun de ces carrés a été attribué un 
nombre qui représente une nuance de gris. La finesse de la décomposition 
(le nombre de carrés) est la définition de l’image. La définition de cette 
image particulière n’est pas bonne : on devine les pixels (mot fabriqué avec 
les débuts des mots anglais picture element). 


Toute image n’utilisant que le noir et le blanc peut ainsi être représentée par un tableau contenant 
autant de cases que l’image contient de pixels, chacune de ces cases étant occupée par 0 ou 1. L’image 
est donc représentée par une matrice dont tous les éléments sont 0 ou 1. 


L'adresse du site consacré à Turing est : http://www.turimg.org.uk/turing/scrapbook/run.html 


2. Opérations sur les images 


1 O0 O1 I O0 01 1 O0 01 
1 1 O0 O0 OI 0 O1 1 1 0 
A=|1 0 0 O0 1 0 B=|0 1 1 1 O0 1 
1 0 0 0 0 0 O1 1 1 1 1 
O 1 1 O0 1 O0 10010 


On transforme la matrice À associée à l’image de gauche en remplaçant 1 par 0 et 0 par 1, on obtient 
la matrice B, associée à l’image de droite, qui est le négatif de l’image de gauche. 
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On peut également coder des images en nuances de gris en attribuant à chaque pixel un nombre 
compris entre 0 et 1, proche de 1 si la case est gris foncé, proche de 0 si elle est gris clair. On peut 
également définir l’image négatif de l’image de départ en lui associant la matrice dont les éléments 
sont les compléments à 1 des éléments de la matrice de départ. 


Les deux images ci-dessus sont le négatif l’une de l’autre. D’autres critères peuvent être enregistrés 
dans les éléments de la matrice associée à une image, la luminosité par exemple. Une multiplication de 
tous les éléments de la matrice représentant la luminosité par un même facteur modifie la luminosité 
de l’ensemble. 


Si deux images ont le même format et la même définition (associées aux matrices 4 et B), il est 
possible de leur faire correspondre leur somme, associée à la somme des matrices qui les définissent, 
en convenant qu’un coefficient supérieur à 1 donne un pixel de couleur noire. On peut aussi leur faire 
correspondre leur différence, avec cette fois la convention que tout pixel associé à un nombre négatif 
est blanc, ou restituer l'image positive [4 — B| en particulier pour différentier les images et faire 
apparaître la trame des contours, horizontaux, verticaux, obliques. 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/image/imagel .jsp, 
http://euler.ac-versailles.fr/wm3/pi2/image/image2.jsp, 


http://euler.ac-versailles.fr/wm3/pi2/image/image4.jsp, 


http://euler.ac-versailles.fr/wm3/pi2/image/image6.jsp, 


Le logiciel Scilab peut également permettre des opérations sur les images, en lien avec les matrices. 
L’annexe 1 fournit quelques compléments à ce propos. 


3. Comment modifier la forme d’une image ? 


On se propose de transformer l’image de droite en sa symétrique par rapport à l’axe vertical, l’image 
de gauche. Pour cela, il suffit de représenter le symétrique de tout pixel de l’image de droite. Chaque 
pixel étant d’une seule couleur, l’image obtenue est bien la symétrique de l’image de départ. 


Des photos de la spirale de Fibonacci dans le métro de Naples se trouvent à l’adresse suivante : 
www.danpiz.net/napoli/trasporti/Stazione Vanvitelli.htm, page d’un site touristique sur Naples. 
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4. Des matrices pour réaliser des transformations 


À tout point du plan, de coordonnées 62 ») données dans un repère (que nous choisirons orthonormal 


pour que l’action sur les figures soit mieux visible), on peut associer un autre point, de coordonnées 


a b 
(x, y’) définies par l’action d’une matrice carrée | | sur | 


Ë 
+ a b\fx x'=ax+by 
L , Ou encore : 
y' 6 “dy y'=cx+ dy 


Si, par exemple, a=—1, b=0, c=1 et d =0, les coordonnées x et y d’un point quelconque sont 
transformées en —x et y, qui sont les coordonnées de son symétrique par rapport à l’axe vertical. 


| ce qui s’écrit : 
2 


Les images suivantes fournissent sur une vue de la Bièvre aux Gobelins extraite d’une carte postale 
d’époque, des exemples d’actions d’une matrice sur une image. 


Exercice : Trouver les coefficients correspondants. 


Réflexion d’axe (Oy) Symétrie centrale 


Réduction (multiplication des dimensions par 0,5)  Affinité orthogonale de base l’axe (Oy) de rapport 0,5 
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IT. Définitions et premiers calculs avec des matrices 


Dans cette partie, le vocabulaire spécifique aux matrices, les opérations sur les matrices et quelques 
résultats théoriques sont présentés après une introduction « intuitive » des notions dans le cadre de la 
résolution de problèmes comme dans les exemples proposés dans la première partie. Dans la partie III, 
d’autres problèmes seront résolus et on s’autorisera alors l’utilisation des matrices et la référence directe 
aux résultats théoriques énoncés dans la partie II. 


A. Matrices. Opérations 


1. Quelques définitions, quelques notations 


Deux entiers naturels m et n étant donnés non nuls, on appelle matrice de format (m, n) tout tableau 
rectangulaire de mxn éléments, disposés sur m lignes et n colonnes. Dans les situations abordées ici, 
les éléments en question sont des nombres réels. 


di di; d, 

La matrice À = peut aussi être notée À = (a, ;) , la notation a; désigne 
dy dy_12 dyin 
di dy . Ern 


le coefficient (l’élément, le terme) situé à l’intersection de la i-ième ligne et de la j-ième colonne. 
C’est le coefficient générique de la matrice À. 


Lorsque m=n, on dit que la matrice est carrée (carrée d’ordre n si nécessaire). Les éléments 
Ai do > Aygo An 1 15 A SONt les éléments de la diagonale principale de la matrice. 


nn 


La matrice identité d’ordre n est la matrice carrée d’ordre n dont tous les coefficients sont nuls à 
l’exception de ceux situés sur la diagonale principale qui sont égaux à 1. Elle est souvent notée J,. 


L’égalité ne peut intervenir qu’entre deux matrices À et B de même format : elle signifie que, pour 
tout indice 7 et pour tout indice j, a;, = b,;. Une matrice dont tous les coefficients sont nuls est dite 


matrice nulle (mais deux matrices nulles qui n’ont pas le même format ne sont pas égales). 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/matrice/coefficient1.jsp 


http://euler.ac-versailles.fr/baseeuler/recherche_fiche.jsp?theme=—4 


2. Addition. produit par un scalaire 


On peut faire la somme de deux tableaux de nombres ayant même nombre de lignes et de colonnes en 
procédant par addition place par place. C’est ce procédé qui est retenu pour définir l’addition de 


matrices de même format. Dire que les matrices À, B et C, de format (m,n) , sont telles que 
C=A+B, c’est dire que : 

pour tout entier À compris entre 1 et m, pour tout entier j compris entre 1 etn, c,, = a,;+b,;. 

On peut de même multiplier tous les éléments d’un tableau de nombres par un même nombre (pour 
appliquer une taxe, par exemple). C’est ce procédé qui est utilisé pour multiplier une matrice À par un 
scalaire À (un nombre réel). On note 14 la matrice obtenue. On a donc (avec une simplification de la 
notation) : AA = (lai). 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/matrice/sommel.jsp 
http://euler.ac-versailles.fr/wm3/pi2/matrice/produit4.jsp 


http://euler.ac-versailles.fr/wm3/pi2/matrice/pdf/sommel.jsp 
http://euler.ac-versailles.fr/wm3/pi2/matrice/somme2.jsp 
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3. Produits de matrices 
Dans la partie I, nous avons rencontré : 


o des produits de matrices de format (m, n) par des matrices colonnes de format (n, 1) tel : 


2 
30 Il 5 2 3 4 \1 
29,2|=|11 4,7 L8 3,1 3,8|3 
30,2 0,9 5,1 19 3,2 4 3 
2 


o des produits de matrices lignes de format (1, m) par des matrices de format (m, n) tel : 
0,6 0,2 0 0,2 
0,1 0 0,8 0,1 
0,5 0 0,33 0,17 
0 0 0 0 


o et des produits de matrices carrées par elles-mêmes, illustré par le schéma suivant : 


(10,7 2,4 6 3,9)=(12 5 6 3) 


0:1:0 
Lioit 
Dim 14 D 
0:1:0 
0 1 O0 
dns 5 0 
203 lo(Go 
0 1 O0 
l'y 1 
2 2 


Plus généralement, soit À une matrice de format (m, n) et B une matrice de format (n, p). Le produit 
de À par B est la matrice C de format (m, p), notée AB, dont, pour tout À compris entre 1 et m et pour 
tout j compris entre 1 et p, l’élément c;;est la somme des produits terme à terme des éléments de la 


i-ième ligne de À par les éléments de la j-ième colonne de B: c,, = ÿ a, ab; 


Par exemple le produit d’une matrice de format (2, 3) par une matrice de format (3, 4) donne une 


matrice de format (2, 4) : 


49120 à 
12022 1 
-113:0 0 


1 2 0\ — 6 4 I 
LOL bp: 
L'utilisation du logiciel Scilab, qui dit si oui ou non la multiplication est possible, peut être 
extrêmement intéressante. 
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Il peut également être riche d’enseignements de différencier les produits de Hadamard (produit termes 
à termes de deux matrices) et produit de Cayley précédemment défini, ce que permet aussi le logiciel 
Scilab 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/matrice/produit3.jsp 


http://euler.ac-versailles.fr/wm3/pi2/matrice/produit2.jsp 
http://euler.ac-versailles.fr/wm3/pi2/matrice/pdf/produit3.jsp 


http://euler.ac-versailles.fr/wm3/pi2/matrice/pdf/produit2.jsp 


http://euler.ac-versailles.fr/wm3/pi2/matrice/produitS.jsp 


4. Propriétés du produit des matrices carrées d’ordre n 


Nous nous intéressons à présent au produit des matrices carrées d’ordre n. Ce produit n'est pas 
commutatif, ce qui signifie que, dans le cas n = 2 par exemple, il existe des couples de matrices (4, B) 


1 2}f2 0 8 2 2 O\f1 2 2 4 
tels que AB z BA. Voici un exemple : — et — ; 
È JC ) de . k 1 , Fe ‘ 


Certaines matrices ne sont pas inversibles pour ce produit. On a, par exemple : 


1 2}f2 1) f10 5 JL 

3 4/4 2) (22 11) (9 14 2) (22 1): 
On observe sur cet exemple que le produit de deux matrices distinctes par une même matrice donne 
deux matrices identiques. 


En revanche les propriétés d’associativité (effectuer BC puis multiplier à gauche par À revient au 
même qu’effectuer AB puis multiplier à droite par ©) et de distributivité par rapport à l'addition (le 
produit de À par la somme de B et C est la somme des produits de À par B et de À par C) font de 
l’ensemble des matrices carrées d’ordre 2 un cadre assez confortable pour les calculs. 


Enfin on peut vérifier que, pour toute matrice À carrée d’ordre n, A1, = 1,4 = À. 


B. Les matrices sont-elles inversibles ? 


Nous avons vu que le produit des matrices carrées d’ordre 2 n’est pas commutatif. Le problème de la 
recherche d’un inverse pour une matrice donnée M s’exprime donc de la manière suivante : existe-t-il 
une matrice N telle que: NxM=MxN=-1L7 


Nous avons vu que les matrices ne sont pas toujours inversibles : en effet, il existe des matrices À, B et 
C' telle que AxB=AXC, bien que B soit distincte de C. Ce résultat met en évidence la non 
inversibilité de la matrice À (sinon on pourrait multiplier par l’inverse de À et obtenir B = C). En vertu 


de la distributivité évoquée plus haut, il vient A x (B —C ) = O, (O> matrice nulle d’ordre 2) ; il y a 


donc des diviseurs de O dans l’ensemble des matrices carrées d’ordre 2. 


Condition pour qu’une matrice carrée d’ordre 2 soit inversible 


di do Ds : X y 
et on cherche s’il existe une matrice B = telle que 
Zz tt 


On se donne une matrice À = 
dy dy 


AxB=BxA=L. 


La première égalité s’écrit : Fa ef ?) -( i ou encore fe er) -( . 
0 1 


dy Adn)\z dyX+dnZ 4dyy+at 
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On obtient deux systèmes d’équations du premier degré à deux inconnues : 


aiX+4apz =] ay + dpt =1 
et ; 


aX+4a,2z=0 A1} + Apt =0 


Les seconds membres des équations de chacun de ces deux systèmes nous indiquent que la condition 
nécessaire pour qu’ils admettent des solutions (et en l’occurrence, ce sera un couple de solutions 


unique) s’écrit : anian — aan #0 (D) 
La quantité 4,,4,, —a,,4@,, est appelée déterminant de la matrice A. On vérifie que si le déterminant est 


d22 Td12 


11422-21412 1142221412 


non nul et si on pose = dé Fr , les produits AB et BA sont tous les 


1142221412 11422-21412 
deux égaux à 2. La condition (D) est donc une condition nécessaire et suffisante d’inversibilité. 


La matrice B est appelée matrice inverse de la matrice À et on la note À !. 


C. Puissances de matrices carrées d’ordre 2 ou 3 


Les problèmes rencontrés dans la première partie nous ont amenés à calculer des puissances de 
matrices. On peut faire les calculs avec une calculatrice pour des matrices de petite taille et des 
puissances raisonnables, on peut faire les calculs à l’aide d’un logiciel pour des puissances explicites, 
à l’aide d’un logiciel de calcul formel pour obtenir, dans les bons cas, des formules « closes », donnant 
l’expression des coefficients en fonction de l’exposant, mais il est plus difficile d’obtenir, dans le cas 
général, ce que nous avons appelé des limites. 


1. Quelques matrices particulières 


a) Les matrices triangulaires 


Les matrices triangulaires ont des puissances triangulaires. 


H 
Considérons par exemple la matrice T=| 0 b e 
0 0 ©c 


Une telle matrice est dite triangulaire supérieure, car ses coefficients situés sous la diagonale 
principale sont nuls. 


a” ad+bd af +de+cf 
On obtient : T° =| 0 b° be+ec  |.On pourrait poursuivre par une démonstration par 


0 0 c° 


récurrence pour prouver que, pour tout entier p strictement positif, T ? est une matrice triangulaire 
supérieure. 


0 d f 
Les matrices strictement triangulaires comme U =| 0 O0  e |ont leurs puissances nulles à compter 


0 0 O0 
ed 


de la troisième au plus. En effet : U° = et U* =0O,. Les matrices dont les puissances 


OS © © 
OS © © 


0 
0 
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sont nulles à partir de l’une d’entre elles sont dites nilpotentes. 
Une application des matrices triangulaires est présentée au IL. F. 


b) Les matrices diagonales 


Les matrices diagonales (dont tous les coefficients non situés sur la diagonale principale sont nuls) ont 
des puissances diagonales dont les coefficients sont les puissances des coefficients initiaux. 


c) Les matrices « creuses » 


D'une façon générale, les matrices « creuses », celles dont beaucoup de coefficients sont nuls, sont 
recherchées, car cette particularité permet de gagner du temps de calcul machine. Ce gain de temps est 
aussi dû à la possibilité de réaliser des produits de matrices « par blocs ». 


2 718 4 1 7 18 3 
11 0-5 0 D 215$ 
Considérons les matrices À = et B= . Les lignes 
4 | 3. à 0 4 2 11 
1 7,2 -8 les 7 2 


horizontales ou verticales tracées font apparaître des matrices : 
Ch #)e s=[re . 
A1 À; B; B, 


26 2 Il 
Par exemple, À, ( s B;, -( a Les produits envisagés ayant tous un sens (il y a 


compatibilité entre les tailles des matrices à multiplier à chaque étape), on souhaite écrire que : 


#8-[7 ir bre à 
4, 5 B; B,;, 41B, ce AB 41B5 + AB 


Et, constatant que les sommes de produits de matrices sont elles aussi réalisables : 
2 32) [4 20 -19 6\,f-12 80 —2 52 -31 86 
Hi 57 60 0 88 33) (-10 -55 11 57 78 -22 


0 8) {9 -33) f-20 0) [6 51 AB=|9 —41 49 SI 
_] 21) |-8 48 33 =3l | 55 6 9 27 95 3 


Beaucoup de systèmes de calcul numérique travaillent, en interne, sur des listes ordonnées ou sur des 
tableaux. Si ces tableaux contiennent beaucoup de 0, les calculs seront plus faciles et sans doute plus 
justes, mais pas forcément moins longs si on n’a pas pris en compte l’abondance de ces 0. 


AB = 


\O 


Dans les situations de problèmes « à compartiments », par exemple, il est fréquent qu’à partir d’un état 
on ne puisse passer qu’à un état Voisin, ce qui se traduit par une matrice de transition contenant 
beaucoup de 0. 


Mais il y a naturellement des situations, très nombreuses, dans lesquelles les premières puissances 
d’une matrice ne laissent pas conjecturer la forme de sa puissance n-ième. On peut alors avoir recours 
à la diagonalisation, évoquée dans le paragraphe qui suit. 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/matrice/puissance2.jsp 
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2. Diagonalisation éventuelle d’une matrice carrée d’ordre 2 


Les matrices considérées dans ce paragraphe sont toutes à coefficients réels. 
Nous adoptons la définition suivante : 
on dit qu’une matrice carrée À est diagonalisable s’il existe une matrice carrée P inversible et des 
réels a et B tels que P É "| 2, 
Compte-tenu de ce qui a été dit sur les matrices diagonales, on voit que, si la matrice À peut s’écrire : 
A=PxDxP, 
où D est diagonale, alors, pour tout entier naturel non nul n : 
A'=PxD'xP", 
ce qui facilite considérablement les calculs. 
Cherchons une condition nécessaire et suffisante pour que la matrice À soit diagonalisable. 
Notons P — fe 2) une matrice inversible réalisant l’égalité À = P x DxP 


L'égalité À = P x D x P l'est équivalente à l’égalité À x P = P x D qui donne : 


di di2 a b . dia + di2C d11b + 4 . _ & b F ë) …. | 
À * P E fr 2.) Le 2 : le + d22C 21h + d2d _ F à ? L ( 0 B E ca dB 


Considérons les matrices colonnes V = # et W = É 


d 
a — , AV = av 
On observe que l'égalité À x P = P *x D est équivalente au système suivant : } 44 BW: : 


Par ailleurs, on a vu précédemment que la matrice P est inversible si et seulement si ad — bc # 0 ce qui 
équivaut à dire que les vecteurs (a, c) et (b, d) ne sont pas colinéaires, c’est-à-dire que les matrices 
colonnes V et W ne sont pas proportionnelles. 


Remarque : 


On observe que si les matrices colonnes V et W ne sont pas proportionnelles, alors nécessairement 
elles sont toutes deux non nulles. 


En conclusion, on peut énoncer la condition nécessaire et suffisante suivante : 


Une matrice carrée À d’ordre 2 (à coefficients réels) est diagonalisable si et seulement s’il existe 
deux réels & et B (non nécessairement distincts) et deux matrices colonnes à coefficients réels non 
proportionnelles V et W telles que AV = al et AW=f$W. 


Les réels « et f (s’ils existent) s’appellent les valeurs propres de la matrice A. 


Remarque : 


Les matrices carrées d’ordre 2 ne sont pas toutes diagonalisables. 


di, dn 


En effet, si on écrit la matrice À sous la forme : À -| | dire que le produit de la matrice À 
a 


1) d» 
par la matrice colonne V non nulle est proportionnel à V, c’est dire qu’il existe un réel À et un couple 


de réels non tous les deux nuls (v, v;) tels que É sn) 2 = À Fu 
, { 21  A22/ \V2 V2/ 
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Cette dernière condition traduit aussi l’existence de réels X, v. et 02 tels que : 


2 — À)v1 + av = 0 
dz101 + (a22 — A) = 0 


Si le déterminant du système d’équations linéaires en v. et v, écrit ci-dessus n’est pas nul, alors il n’a 
que le couple nul comme solution, ce qui ne satisfait pas l’hypothèse. 


L'hypothèse exige donc que ce déterminant soit nul, c’est-à-dire que : 
2 
À — (a11 + 22) À + 11022 — Az1@12 = 0. 


L'existence des matrices colonnes V et W exige donc que l’équation du second degré en À ci-dessus 
admette des solutions réelles, ce qui n’est pas toujours le cas, c’est pourquoi on peut dire que les 
matrices carrées d’ordre 2 à coefficients réels ne sont pas toutes diagonalisables. 


Considérons par exemple la matrice J = _ 4. Pour elle, l’équation en À s’écrit À ? + 1 = 0, qui 


n’admet pas de solutions réelles. Donc la matrice J n’est pas diagonalisable. 


nr . pour laquelle l’équation en Às’écrit 


N= 0 n’est pas non plus diagonalisable, mettant ainsi en évidence le fait que l’existence de solutions 
de cette « équation en À » est une condition nécessaire non suffisante de diagonalisabilité. 


On pourrait également vérifier que la matrice H = ( 


D. Traitement matriciel des suites de Fibonacci 


On s’intéresse dans ce paragraphe à la suite de Fibonacci, définie par : 


u, =1, u, = 1, et, pour tout entier 7 : U,,, =u 


1. Recherche d’une formule « close » pour le terme général 


Spirale de Fibonacci dans le métro de Naples 


On peut écrire, avec des notations à présent mieux maîtrisées : 


U,42 _ 1 1 Ur 
Us . l 0 u, | 
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1 1 
La matrice F = f : peut être écrite comme le produit PDP", où : 


1+V5 1  v5-1 
0 V5+1 1-V5 5 
2 _ D = — V5 2V5 
D = ; P = 2 2 et P _— 
ir V5 - : 1 v5+1 
2 V5 245 
5 ; U,u 1 1) U; 
Un raisonnement par récurrence donne, pour tout n : = : 
u, IMUAUr 
ou encore : 
1+ #) 1 5 
. 0 _…., M 
pr) ere | 2 5 1 e«) 
=| 2 2 | 
u, ( ( 1=sY | 1 V5+1/{w 
” ; V5 245 
n+] n+1 
Tous calculs faits, pour tout # supérieur ou égal à 2 : u, = Lf1+vs _ Li vs : 
51 2 V5 2 


Certains pourraient trouver ce résultat étonnant, remarquant que, du fait de la définition, tous les 
termes de la suite sont entiers. Pour se convaincre que la formule ci-dessus donne bien des entiers, il 
suffit de comparer les termes d’ordre pair et les termes d’ordre impair des puissances à développer. 


2. Trouve-t-on toujours une combinaison linéaire de suites géométriques ? 


Nous avons écrit le terme général de la suite de Fibonacci de premiers termes 1 et 1 comme une 
combinaison linéaire des termes de deux suites géométriques. 


Les calculs précédents sont adaptables à toute suite # dont les deux premiers termes sont donnés, et 
telle qu’il existe deux réels a et b pour lesquels pour tout » > 0, u,,, = au,., +bu,, pourvu que la 


a b 
matrice M = É À associée soit diagonalisable. 


E. Retour sur les marches aléatoires 


Dans ce paragraphe, nous nous intéressons de nouveau à des marches aléatoires, dans le but de 
montrer qu’on peut, dans certains cas, découvrir des formules de récurrence pour déterminer les 
puissances n-ièmes de matrices de forme particulière. 


Marche aléatoire sur un cube 
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Dans la marche aléatoire aux sommets d’un cube, le personnage peut passer à chaque étape d’un 
sommet à un des trois sommets voisins. Nous supposons qu’il y a équiprobabilité dans les passages 
d’un sommet à un autre. On associe à cette situation la matrice de transition suivante dans laquelle le 
coefficient situé à l’intersection de la i-ième ligne et de la j-ième colonne est la probabilité qu’un 
mouvement partant du sommet i s’achève au sommet j. 


Cette matrice est : 


0 1 O0 1 1 0 0 0 

1 01 0 0 1 0 0 

0 1 O0 1 O0 O0 1 O0 
Pet 0 1 0 0 0 01 
311 0 0 0 01 01 

0 1 0 O1 0 1 O0 

0 01 0 01 01 

0 0 0 1 1 O0 1 O0 


Les particularités de cette matrice (elle est symétrique, c’est-à-dire symétrique par rapport à la 
diagonale principale, elle est décomposable en quatre blocs dont deux sont la matrice identité d’ordre 
4) permettent de trouver intuitivement la forme de sa puissance n-ième. 


On peut prouver par récurrence l’existence de quatre suites (u:), (1), (Wa), (tn), dont les termes sont les 
coefficients de la matrice M” de la forme suivante : 


A B C D 
M? = : : : É , Où 4, B, C'et D sont les quatre matrices carrées d’ordre 2 définies par : 
D C B A 
[Un Un L{(Wn Un (Un Wn L(Xn Wn 
2 é JE n ea sa 7 fe se En Le .) 
Après calculs, on obtient : 
1+(-1)7 37+3 1+(-1)7 3-1 
UE GX 3n OMS * 
_1-(-1} 1+3" - _1-(-1 3-3 
Mg Xe Meg 
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III. L’outil matrices à l’œuvre Compléments et exemples 


Dans cette partie, nous serons amenés à utiliser des propriétés des matrices, ou des représentations 
matricielles de situations sans revenir sur ce qui a été développé dans la partie IL. Tous les résultats ne 
sont pas établis, et ce point n’est pas nécessairement précisé chaque fois. Certaines des applications 
proposées devraient motiver les élèves et, espérons-le, susciter des vocations : aider les élèves à 
affirmer leur choix d’études supérieures scientifiques longues est le but de l’enseignement de 
spécialité mathématiques. 


A. Matrices en arithmétique 


1. Cryptographie : le chiffrement de Hill 
a) Introduction et principe 


Dans les plus anciens systèmes de cryptographie, chaque lettre est remplacée par une autre lettre, 
toujours la même. Les premières améliorations consistèrent à remplacer une lettre donnée par une 
autre, choisie en fonction de la place de la lettre à coder dans le texte de départ (en utilisant un mot- 
clef, par exemple). Le système de Hill (Lester S. Hill, Concerning certain linear transformation 
apparatus of cryptography, in American mathematical monthly, vol 38, (1931), p135 — 154) 
transforme des chaînes de caractères de longueur donnée, chaque lettre étant alors transformée en 
fonction de sa valeur et de sa place dans la chaîne de caractères. 


On se donne un entier naturel n supérieur ou égal à 2. Le texte à chiffrer est découpé en blocs 
successifs de n lettres. S’il y a un reste, on peut compléter arbitrairement le texte ou l’amputer du bloc 
incomplet. Les lettres de chaque bloc sont remplacées par des nombres (généralement À = 0, B = 1, 
C=2,...,Z = 25), et à chaque bloc de lettres est associée une matrice colonne B; à n lignes. On se 
donne une matrice carrée M d’ordre n, appelée matrice de chiffrement, connue de l’expéditeur et du 


destinataire du message, à coefficients entiers naturels. Le produit C; = MB, est une matrice colonne 


qui peut à son tour être transformée en une suite de n lettres, chacun de ses éléments étant ramené à 
son reste modulo 26 puis transformé en la lettre correspondante de l’alphabet. Pour décoder, il faudra 
faire le chemin inverse (si toutefois la suite des deux opérations produit de la colonne par la matrice 
suivie de détermination du reste modulo 26 est « inversible »). 


b) Exemple 


2 à 
Utilisons la matrice M = k A . Soit à chiffrer le texte CODAGE DE HILL. Le découpage en blocs 


de deux lettres et leur transformation en matrices colonnes donne : : : Ê : ais ; 
14) (0}/ (4) (4) {8} (11 


Les matrices colonnes obtenues par l’action de M sur les matrices colonnes précédentes sont : 
74) (6) [32] (26) 54) 77) 22) f6\ f6\ (O\/2\ (25 
62] (o) (34) [25] (53) [77] > qui, modulo 26, donnent : 10) lo! el los al lol 

Le texte crypté est donc WK GJ GI AZ CB ZZ. Nous verrons par la suite comment le décrypter. 


4 2 
Utilisons la matrice N = Ë . Soit à chiffrer le texte AMER. Les mêmes procédés donnent les 


0 4 24 50 24 24 
matrices colonnes , transformées en , OU Encore en , le texte 
12 17 96 148 18 18 
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crypté est donc YS YS, ce qui pose un problème puisque deux groupes de deux lettres différents ont 
été cryptés de la même manière. On perçoit ici les difficultés que va soulever le décryptage. 


c) Réversibilité du cryptage 


x X 
Si les deux matrices colonnes, produits respectifs de deux matrices colonnes distinctes | }s | y | par 
X 


a b 
| | sont formées d’éléments ayant respectivement même reste modulo 26, on peut écrire : 
£ 


ax +by = aX +bY mod26 
cx+dy=cX dY mod 26 


On suppose par exemple que x et X sont distincts. Le système précédent conduit, en vertu des 
propriétés des congruences, à (ad —bc)(x- X)=0 mod 26. 


Cette relation exprime le fait que 26 est un diviseur de (ad —bc)(x-X ), or (x—X) est en valeur 


absolue strictement inférieur à 26 et non nul. Les diviseurs premiers de 26 (2 et 13) ne peuvent donc 
tous deux diviser (x — #). Il s’ensuit que (ad — bc) et 26 ne sont pas premiers entre eux. 


La condition « (ad- bd) est premier avec 26 » est donc une condition nécessaire pour que deux blocs 
de deux lettres différents soient cryptés différemment. 


Nous admettons que cette condition est suffisante pour assurer le décryptage de tout message. 


d) Exemple de décodage 


, 2 5 | . | . EE 
La matrice M = | ; est certes inversible, mais sa matrice inverse, telle qu’elle a été définie 


précédemment ne répond pas au problème posé, mais ses coefficients vont être une aide pour répondre 
au problème posé. En effet, on trouve : 


7 7 


Pour assurer le décryptage, on cherche une matrice N à coefficients entiers telle que les coefficients 
des matrices MN, NM et I, soient congrus modulo 26. 


Le calcul précédent de M ‘ fait apparaître que : 


Re SR ee ae 
3 4] 3 2) (3 -2]13 4) Lo 7) * 
Il ne reste donc plus qu’à déterminer l’inverse de 7 modulo 26, c’est-à-dire un entier w tel que 


Tu =1 mod 26. Comme 7 et 26 sont premiers entre eux, il existe un unique entier # compris entre 0 et 
25 et on trouve u =15. 


On a donc 15x7 =1 mod 26 ce qui se traduit par 15 est l’inverse de 7 modulo 26. 
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2 —4 
La matrice inverse modulo 26 de M = k } est donc la matrice M'= | : . Cette matrice est 
18 2 
égale à + modulo 26. 
19 22 


Le texte crypté, scindé en blocs de deux lettres est WK GJ GI AZ CB ZZ. 


22) (6) f6)f0)\/2\/f25) 
Les rangs correspondants sont yo! lol lel los) l1ll25 


Le bloc décrypté est obtenu en multipliant M ‘par chacune des matrices colonnes précédentes et en 
retenant le résultat modulo 26, soit : 


(ss) (ae) 5) (50) en) Us) 
MIDIPIRININ 


et qui permet de retrouver le texte initial CODAGEDEHILL. 


ce qui donne, modulo 26 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/crypto/hilll.jsp 
http://euler.ac-versailles.fr/wm3/pi2/matrice/inverses.jsp 


2. Approximation des nombres réels 
a) Quelques rappels sur les fonctions homographiques 


. L : . x : . » . + x 
Nous nous intéressons aux fonctions homographiques à coefficients entiers définies sur R°, c'est-à- 
. . » . + . . ‘ 
dire aux fonctions f définies sur R° pour lesquelles il existe des entiers naturels a, b, c, et d tels que, 
ax + b 


pour tout réel positif x, f (x) - Parmi ces fonctions, certaines sont constantes (celles pour 


lesquelles ad — bc = 0 ), certaines sont affines (celles pour lesquelles c = 0 ). 
Il peut donc y avoir débat d’auteurs sur la définition. 


Pour l’instant, nous nous contentons d’écarter la situation c = d = 0, pour laquelle il n’y a tout 
simplement pas de fonction. On peut aussi observer que le quadruplet (a,b, éd ) servant à 
caractériser une fonction comme homographique n’est pas unique. Bref, nous ne travaillons pas dans 


un cadre assuré. La propriété intéressante, que nous souhaitons utiliser pour cette étude, est qu’une 
: : À ne . de 
fonction homographique à coefficients entiers naturels est monotone sur R° et prend toutes les 


CR : : &: D | 
valeurs comprises entre 4 et — si elle est croissante, toutes les valeurs comprises entre — et 4 si 
e C 


elle est décroissante (on peut aussi dire que le sens de variation est donné par le signe de ad —bc). 


b) Le calendrier : approximation d’un rationnel par un rationnel « plus simple » 


Au début de l’année 2000, l’année tropique (intervalle de temps séparant deux passages du soleil 
dans la même position sur son orbite apparente — l’écliptique) était mesurée à 365,242 190 517 jours. 
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Comment faire varier le nombre (entier) de jours dans une année sans bouleverser les habitudes de vie ? 


C’est la question que des gouvernants ont eu à résoudre (en Égypte antique, à Rome sous Jules César, 
en Europe au XVIe siècle). 


Les égalités suivantes, obtenues en utilisant l’algorithme d’Euclide : 


1000000000 =4x242190517+31237932 242190517 1 

242190517=7x31237932+23524993 1000000000  ,, l 

31237932 =1x23524993+7712939 de 
permettent 1+ 

23524993 =3x7712939+ 386176 dei 1 

7712939 =19xX386176+375 595 l 


386176=1x375595+10581 74 10581 
375595 


Remarque : On peut naturellement poursuivre l’algorithme, mais cela n’aurait pas de lien avec 
l’objectif, qui est de fournir des approximations permettant de fabriquer un calendrier. Le 
calendrier grégorien prévoit d’ajouter 97 jours tous les 400 ans (1 jour tous les 4 ans sauf pour les 
millésimes multiples de 100 mais pas de 400). Rappelons que le rapport entre la durée de l’année 
tropique et celle du jour sidéral — durée de la rotation de la Terre sur elle-même — subit des variations 
telles qu’il est illusoire de les prévoir sur plusieurs milliers d’années. 


Comme dit précédemment, pour tout réel positif x, 


. .. . 
est compris entre 0 et — . L’ajout d’un jour 
x+4 4 


tous les quatre ans à l’année calendaire est donc exagéré. Si on poursuit les calculs, on peut écrire : 


242190517 = l = 7+7 , Ce qui permet d’affirmer que 2242190517 
1000 000 000 ad 4y +29 1000 000000 
7+7y 
Ajouter 7 jours tous les 29 ans à l’année calendaire n’est pas suffisant. Poursuivons les calculs à 
l’étape suivante : 


_ \ 7 
est supérieur à —. 
29 


242190517  7z+8 
1000000000  297+33 
qu’encore exagérée. 


8 2 . là 
montre que = une nouvelle approximation, meilleure mens 


31 ; ; 
Les fractions suivantes, —et sont successivement des approximations par défaut et par excès 
Il 


2465 

des modifications à apporter au calendrier pour s’approcher du rapport entre la durée de l’année 
tropique et celle du jour sidéral. Les valeurs approchées fournies sont (d’un certain point de vue qui 
sera développé dans la partie III) les meilleures possibles, mais on ne retrouve pas parmi elles les 


97 
— du calendrier grégorien. 
400 


Il est possible d’écrire ces calculs autrement : chaque nouvel « étage » de la fraction écrite plus haut 
peut être interprété comme l’intervention d’une fonction homographique. En appelant f, la fonction 


, 1 : 
définie sur R° par FA (x) = , On peut écrire : 
X+n 


7 =foféfsper, 1) Cette décomposition montre que les 


1000 000 000 313995 


approximations trouvées le sont sous forme irréductible, et alternativement par excès et par défaut (les 
fonctions qu’on compose sont toutes décroissantes). 
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Il est possible de placer les coefficients des fonctions homographiques intervenant dans des tableaux, 
0 1 | 0 I\f0 1 1 p 

de sorte que, f, étant représentée par , J,°$, le serait par = : 
ln . 1 nl p n l+np 


forme qui illustre le fait que , ° f, est différente de f, ° f, dès que 7 et p sont différents. 


n 


c) L’exemple de V2 


x+2 


le 
puisque —1 n’en est pas solution. Ce nombre est donc sa propre image par l’application de R° dans R 


Le nombre V2 est la solution positive de l’équation x° —2 = 0, qui peut encore s’écrire x = 


: __— x+r2 = 
qui donne de tout réel positif l’image j - Les paragraphes précédents fournissent un premier 


X + 
x+2 
+2 
résultat : 42 est compris entre 1 et 2. Mais on peut aussi écrire que 2 est solution de x = + 
x 
+1 
x+l 


es : . 3x+4 . : 
par une substitution légitime. Tous calculs faits, on obtient : x = rt qui nous montre cette fois 
X + 


| 4. + 2. . NT x+2 
que y? est compris entre à et 2 À l'étape suivante, en reprenant l’égalité x = , On trouvera 


x+1l 


; 7x +10 ; 7 10 no. 
que ne) est solution de x = as , et que ce nombre est compris entre - et n (l'écart est inférieur 
X + 


à 3 centièmes). 


d) Lien avec le produit des matrices 


Les calculs précédents nous ont donné l’idée que la composée de deux fonctions homographiques est elle-même 
une fonction homographique. En effet, si on a : 


ax + b a’x + b’ 


FO ra % 80 cg 


Alors on obtient par composition : 


1 b ’ ’ ! ! 4 
a A +b [a'a+be)x+ab+b'a 
pour toutx, g (f(x)) = cx+a r TE 
Fa | (ca+d'e}x+e5+d'a 
cx + d 


avec les précautions évoquées au paragraphe a.). 


: a b\. , | fa" D. 
On observe que si on associe la matrice A = su” à la fonction f et la matrice B = c d?à 


la fonction g, alors la matrice BA est précisément la matrice associée à la fonction g 0 f. 


Cela fournit une technique de calcul des coefficients de la composée de deux fonctions 
homographiques. 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/matrice/homographiquel.jsp 


http://euler.ac-versailles.fr/wm3/pi2/matrice/homographique2.jsp 


http://euler.ac-versailles.fr/wm3/pi2/matrice/homographique4.jsp 


http://euler.ac-versailles.fr/wm3/pi2/matrice/homographiques.jsp 
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e) Le cas du nombre d’Or 


Le nombre d’or, noté ®, est la racine positive de l’équationx” = x+1. Il peut également être 


ue x+1 
considéré comme un point fixe de l’application f, définie sur [+ co] par f (x) = —. 
+ 


La fonction f est décroissante sur [1,+ cof et prend des valeurs comprises entre 1 et 2. ® étant un 
point fixe de cette fonction, on peut obtenir un premier encadrement : 1 <® < 2. 


La relation fo f (œ) = f (®) =® montre que D est compris entre les extremums de la fonction 


x+1l 


— +1 
2x+1 
f ° f . Comme, pour tout x élément de [L+ cf , fof(x) — — , on déduit que : 
x+1 x+1 
x 
- < D<2 
3 SD< 


Nous avons donc amélioré l’approximation par défaut de ®. L’itération suivante consiste à composer une 
fonction croissante ( f ° f ) par une fonction décroissante f. On obtient une fonction décroissante 


fournissant une nouvelle approximation par excès de D. La poursuite du procédé nous donne deux 
suites adjacentes convergeant l’une et l’autre (bien sûr) vers ®. 


f) Les réduites 


L’analogie matricielle introduite précédemment conduit à considérer la suite des matrices 


L 11. f&. & 
| | = | nn | associées aux fonctions homographiques f”. 


n n 


a b a. b \f1 1 a +b. a 
Ces matrices satisfont à la relation de récurrence | Pt | = | : : Il =| © M, 
Cyat du Cy d, l 0 Cy La d, Cy 


où on voit poindre les suites de Fibonacci. 


| | | nn: 
Le quotient du premier terme de la première colonne de la matrice ar le second est une 
q P P 1 0 P 


valeur approchée de ®, alternativement par excès et par défaut. Ces nombres sont appelés réduites du 
développement en fraction continue de ®. 


, . 1 
Le terme fraction continue lui-même provient de l’écriture possible : ® =1+ ] 
1- 
Il 
1+ I 
1+- 5 
ne 
1+9 
Les réduites du développement de ® en fraction continue sont données par le tableau : 
1 2 3 5 8 13 21 34 55 89 144 | 233 
1 1 2 3 5 8 13 21 34 55 89 144 
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g) Les réduites comme « meilleures approximations rationnelles » 
Plus généralement, considérons un nombre réel irrationnel positif x. Soit à, le plus grand entier 


— ; Il 
inférieur ou égal à x. On peut écrire: x = a, +u = a +—-:Le nombre y est à son tour un nombre 
y 


: ; ë : Il — . 
positif auquel on peut appliquer le même traitement : x=4a, +u=a, = À ainsi de suite. On 


a; +— 
Z 


1 OUI O0 


a l\fa, 1 
associe aux fonctions homographiques utilisées les matrices | : | | | etc., qui ont toutes 


n œ n 


pour déterminant —1. Appelons À = é | le produit des n premières. On a alors : 


n n 


P _ N, &, din 1 … Nes +, À 
on Pe B, l 0 L Da, +B, D | 


Les quotients des éléments de la première colonne de la matrice 2 s’écrivent sous la forme de 


n 


fractions irréductibles (le déterminant de P est 1 ou —-1, on applique le théorème de Bézout) et la 


dis 


Il 
relation précédente montre que le produit par la matrice | 0 fait glisser en quelque sorte la 
première colonne vers la droite. 


n 


n 


N .. N 
et À. , et supposons, pour fixer les idées, que —"*1 > F 


n n+l n+l n 


Considérons deux réduites successives 


N N 1 
Rappelons que N,.,,D,—D,,..N, =1 etque —"“1--"- 
D, D, DD, 
idé 1 : n+]l X N, 
Considérons un nombre rationnel — compris entre les deux : > F= > re 


Notons U = D,X-— N,V et V = NY Dh. 
La double inégalité précédente prouve que ces deux entiers sont strictement positifs. 


On en déduit que : X = NU + NV et Y = DU + D,V ce qui prouve que X est plus grand que N,:, et 
Y plus grand que D,:1. 


Les réduites sont donc les meilleures approximations au sens suivant : toute approximation du 
nombre x plus précise que l’une quelconque des réduites a des termes plus grands que 
ceux de la réduite considérée. 


Ressource : http://euler.ac-versailles.fr/wm3/pi2/fractioncontinue/fraction2.jsp 
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B. Matrices et probabilités 
1. La fougère de Barnsley 
a) Des modèles de croissance pour les plantes 


L'observation de la disposition des feuilles sur les tiges des végétaux, de la disposition des boutons 
floraux ou des étamines, a guidé l’étude mathématique puis l’élaboration de modèles de croissance. 
On pourra consulter utilement à ce propos H.S.M. COXETER /ntroduction to geometry, Wiley éditeur 
(Chapitre Phyllotaxis) et le classique LINDENMAYER & PRUSINKIEWICZ The algorithmic beauty 
of plants, Springer éditeur. 


Ces modèles trouvent une utilité toute particulière dans l’industrie cinématographique, par exemple, le 
même modèle permettant de tourner au même endroit (fictif) et consécutivement une scène de 
printemps et une scène d’hiver. 


Les probabilités sont utilisées ici pour modéliser le comportement de la nature. 
b) Une transformation du plan 


Les transformations du plan sont les applications (s#ricto sensu, bijectives) du plan dans lui-même. 
Comme un point du plan est repéré par ses deux coordonnées x et y, une transformation peut aussi être 


à : 2 : À 
vue comme une application de R° dans lui-même. Par exemple, 


f:M(xy)R M'(x,y) 
| x'=x 
OÙ : 
Y'=x+y 


Seules celles dites affines nous intéressent ici. Pour une telle application, il existe des réels a, b, c, d,u 
et v tels que : 


est une transformation du plan. 


f:M(x,y)R M'(x,y) 
: nn 
où : 
y'=cx+dy+v 


bd a b\fx u 
Ce qu’on peut donc aussi écrire : = + , qui peut aussi se noter X'= AX +U 
y' c dy v 


Nous utilisons dans la suite quatre de ces transformations : 


A laquelle À un tU : 
O OUT laquelle = € = 
He 0 0,16 0 


of, pour laquelle À “| Re si et -| ° | 
—0,04 0,85 1,6 
of, pourlaquelle 4 = de 2) etU -| ’ | 
0,23 0,22 1,6 
of pour laquelle À = F. Re mL et u-[ . | 
0,26 0,24 0,44 
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c) La fougère de Barnsley (1988) 
Voici le principe de sa construction, donné au pas à pas : 


o Le premier point à dessiner est l’origine O, de coordonnées (0,0) ; 
o Chacun des points suivants s’obtient en appliquant à son prédécesseur une transformation f, 
égale à f,, >, 3; fa, avec les probabilités données par le tableau : 


à Ji f #3 fs 


P(f=f) 0,01 0,85 0,07 0,07 


Le principe de construction peut être conservé pour créer d’autres variétés de végétaux fictifs, dites mutantes. 


Voici le code Scilab de la fougère de référence, et une représentation avec 10 000 points 


function 
point image-transformation(point antecedent, 
choix) 
if choix == 1 then 
A=1[[0,0];[0,0.16]] ; V=[0;0]; 
end 
if choix == ? then 
A =[[0.85,0.041;[-0.04,0.851] ; V=[0;1.6]; 
end 
if choix == 3 then 
A =[[0.2,-0.261:[0.23,0.22]] ; V=[0;1.6] 
end 
if choix == 4 then 
A=[[f-0.15,0.281;[0.26,0.24]] ; V=[0;0.44] 
end 


point_image = À * point _antecedent + V Une feuille de fougère obtenue grâce 
endfunction au programme de gauche 


nPoints — 10000 
P — zeros(2,nPoints); 
for i — 2:nPoints 
tirage — rand(); 
if tirage < 0.1 then choix = |; 
else if tirage < 0.86 then choix — 2; 
else if tirage < 0.93 then choix = 3; 
else choix = 4; 
end 
end 
end 


P(:,i) = transformation(P(:,i-1),choix); 


end Une fleur, elle aussi « programmée » 
Photographie tirée de « The algorithmic beauty 
plot(P(1;:),P(2,:),"*g"); of plants » 
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Le livre « The algorithmic beauty of plants » est téléchargeable sur le site « The algorithmic botany at 
the University of Calgary » à l’adresse http://algorithmicbotany.org/papers/#abop 


Ressource : http://euler.ac-versailles.fr/wm3/pi2/barnsley/barnsley.jsp 
2. Triangles rectangles pseudo-isocèles. Points à coordonnées entières sur une hyperbole 
a) Triangles rectangles pseudo isocèles 


Appelons triangle rectangle pseudo isocèle (en abrégé, TRPT), tout triangle rectangle dont les côtés ont 
pour longueurs des entiers a, a +1 et c, où c désigne la longueur de l’hypoténuse. 


Par exemple, la séquence (3, 4, 5) définit un TRPI. Elle définit même le « plus petit TRPI » quand on 
classe les TRPI dans l’ordre croissant des valeurs de a. 


Les séquences (a, a + 1, c) sont des triplets pythagoriciens particuliers. Mais tous les triplets 
pythagoriciens ne donnent pas des TRPI, à commencer par les « multiples entiers » des longueurs des 
côtés d’un TRPI donné comme (6, 8, 10) ou (9, 12, 15) obtenus par homothétie. Le théorème de 
Pythagore caractérise les TRPI par les couples (a, c) d’entiers vérifiant l’équation diophantienne : 


a” +(a +1) = 7 (F*) 


Il est alors envisageable de rechercher exhaustivement les TRPI en incrémentant progressivement a et 
en testant le caractère entier du nombre c qui lui est associé. Ce que nous réalisons sur le programme 
Scilab ci-dessous, balayant toutes les valeurs de a comprises entre 1 et 1000. 


for a = 1:1000 
c= sqrt(2*a"2+2*a+1),; 
if c —= floor(c) then 
disp([a,a+1,c]); 
end 
end 


On obtient quatre solutions, les triplets (3, 4, 5), (20, 21, 29), (119, 120, 169) et (696, 697, 985). 


b) Recherche d’une expression générale 


Le programme précédent fournit quatre solutions. Nous cherchons une expression générale fournissant 
toutes les solutions. 


On définit par récurrence les suites (as)::0 et (C1h1>0 par ao — 0, co = 1 et les relations de couplage, 
a, =3a,+2c, +1 


valables pour tout n > 0: ë 
Cu = 44, +3c, +2 


Les raisons pour lesquelles on utilise ces relations sont indiquées en fin de ce paragraphe b. 


On peut vérifier que, si le couple (a,, c,;) est solution de l’équation (**), le couple (a,4, c;1) est lui 
aussi solution, et une solution différente de (a, c,). On peut également prouver que la suite (a:):>0 est 
strictement croissante. À partir du couple (0, 1), on obtient donc une suite de couples solutions. 


On obtient en fait toutes les solutions, résultat dont la justification sort sensiblement du cadre de ce 
document. 


Les couples (a, c) se calculent de proche en proche. Ainsi : 
(a2, 2) = (20, 29) ; (as, cs) = (119, 169) ; (as, ca) = (696, 985) ; (as, cs) = (4059, 5741). 


Le qualificatif de « pseudo isocèles » donné à ces triangles est justifié : 
a, grandissant très vite, le quotient des longueurs des deux cathètes tend vers 1. 
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Éléments de justification des relations définissant les suites (4,)1>0 et (Cn)n>0 


A partir des calculs effectués au paragraphe 4, on obtient : 


do 0, di 3, da) 20, ad; 119, da — 696 et Co 1, Ci 5, C2 29, C3 169, C4 — 985. 


On peut alors vérifier que : c— 6c1 + co = 0, c3— 602 + ci = 0, a2— 6a1 + ao = 2 et a3— 6a2 + ai = 2. 
On définit deux suites (u:)1>0 et (Vn}n>0o par les relations de récurrence suivantes : 


Vo = 1, U=5 t { U = 0, Us = 3 
Pourtoutn21, Uyz2 — 6Vn41 + Un = 0 ' Pourtoutn21, Uni2 — GUn+1 + Un = 2 


On détermine ensuite les expressions explicites de w, et v, pour tout r qui permettent de déterminer le 
système de relations proposé au début du paragraphe b. 


c) Des matrices pour expliciter les solutions 


La construction récurrente décrite ci-avant constitue une première avancée. Mais pour parfaire notre 
étude, donnons une expression close des suites (a,)120 et (Cn>0 afin d’accéder directement à chacun 
des TRPI. 


7 r + dy D 3a, LA 2c, sa | 
Nous pouvons représenter l’écriture par U,. 
Cu =4a, +3c, +2 


| a, Il 3 2 
où: U, = ,V= et M = : 


On obtient successivement : U1 = MUo + V, U> = M Us + MV + V,U3=M°Uo+(M°+M+1)V..… 


1 O0 
avec 1 = : 


On peut plus généralement obtenir par récurrence le résultat suivant : 


= MU, +V, 


pour tout entier naturel n > 0, U, =M'U, +(M"" LM... RM +M+1)V 


Pour exprimer simplement les puissances de Â/, on a recours à la diagonalisation (lorsqu'elle est 
possible). Ce procédé conduit à écrire M comme un produit : M= PDP‘ 


On peut, par exemple, choisir : 


Er 
1 1 3+2V2 0 12 "20e 
P= ( ).» = ( ) tPT= 
V2 -V2 0 3-27 ° L 2 
2 2V2 
On obtient donc : 
ñ 1 1 
ur = (1 : (3+2V2) 0 2 2V2 
v2 —v2 0 G-2#2 Jr 7 
2 2V2 
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On peut se demander où sont passés les nombres entiers, qui constituent le cadre de l’étude. Ils vont, ils 
doivent, réapparaître après ce passage, simplement destiné à permettre le calcul explicite des a, et c. 


On peut écrire, pour n > 0: 
M1 + M 2+...+M2+M+I=P| pe 


où on voit apparaître des sommes de termes de suites géométriques, et donc la fin des calculs. 
Finalement : 


An = LIN (3 + ave + res 2V2y" — 


et 


Cn = PNE (3 4 av" +2 murs 2V2)" 


On ne « voit» toujours pas les entiers dans ces écritures, mais on peut expliquer pourquoi à, et 


C, ainsi définis sont des entiers naturels. 


3. Le problème du collectionneur 


Un fabricant de produits alimentaires propose à ses acheteurs potentiels de constituer la carte de la France 
des 101 départements, chacun de ces départements étant figuré par un aimantin. Chaque conditionnement 
d’un certain produit contient un aimantin, les aimantins étant répartis de manière uniforme. 


On se propose de déterminer le nombre moyen de boîtes qu’un collectionneur isolé, sans possibilité 
d’échanges avec d’autres personnes, doit se procurer pour réaliser la collection complète des départements. 


a) Écriture de la matrice de transition 


Nous allons représenter la situation comme une marche aléatoire entre des points situés sur une droite 
graduée, le point 0 représentant la situation du collectionneur n’ayant encore rien acquis, le point 
générique # celle du collectionneur ayant acquis X aimantins, le point 101 étant le point d’arrivée du 


| : ……, JI0 
parcours. On passe du point # au point # + 1 avec la probabilité 101 ” on reste au point Æ avec la 


k . : 
probabilité 10 Dans la suite, nous utiliserons 71 à la place de 101 pour donner un contenu un peu plus 


général au problème. Pour mesurer la longueur du parcours, nous utiliserons la variable p. Nous 
essayons d’évaluer l’espérance mathématique de la variable aléatoire mesurant le nombre d’achats 
nécessaires à la complétion de la collection. 
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La matrice de transition est une matrice carrée d’ordre n+1. En vertu de ce qui précède, elle ne 
contient d’éléments non nuls que sur la diagonale principale et sur la « sur-diagonale », si on peut dire. 


Elle s’écrit : 


0 


0 


sim 


[= 


0 
= 
RE à 
n 
_2 
= : 0 
n n 
3 
n 


0 0 0 
0 0 
0 0 
0 0 
2 TG 

n 
Go Et à 
nn 
0 0 1 


On peut écrire cette matrice sous la forme : 


OR 


M = 


, où O est la matrice nulle à une 


DA 


ligne et nr colonnes, 7 la matrice à 


x 


un seul 


élément,1, et R la matrice colonne dont tous les 


| 1 
éléments sont nuls sauf le dernier égal à —. 


n 


Cela simplifierait un peu les calculs que nous 
ne ferons pas dans le cas général. 


b) Puissances de la matrice de transition 


Les calculs suivants ont été effectués avec l’outil « Matrice puissance d’une matrice » disponible sur le 
site http://euler.ac-versailles.fr. Les puissances 10, 20 et 30 de la matrice M ont été calculées dans le 
cas ñn =5. On obtient successivement : 


Soit M la matrices définie par 


M 


M* 


0 O0 
O0 O 
0 O 
OR à 
5 

a : 
5 5 
O 1 


et soit k = 10. 


La matrice M* est la matrice définie par 


0 jar 
0 x 
_|[o o 
lo o 
CRE à 
0 oO 


et soit k = 20. 


2044 
1953125 
4092 
9765625 


22392 
390625 
342012 
9765625 
1024 6963 
9765625 390625 


59049 
) 
0 9765625 


0 0 
0 0 


La matrice M* est la matrice définie par 


2097148 


6967277352 


1085570781624 


163704 
390625 
27984 
78125 
2794506 
9765625 
1979054 
9765625 


40824 
78125 
1184304 
1953125 
1359204 
1953125 
7727522 
9765625 
1048576 8717049 
9765625 9765625 


0 1 


143847569376 


1 O O0 
EE | 
5 5 
2 3 
Ci RE à 
5 
0 O0 0 
Ce AR 1 ES 2 
1 
19073486328125 
1 
95367431640625 
0 
0 
0 
0 


19073486328125 


167772 
3814697265625 
1048576 


95367431640625 


0 


0 
0 


19073486328125 
1657264988 
762939453125 
418288299 
3814697265625 
3486784401 


95367431640625 


0 
0 


19073486328125 
174248707248 
3814697265625 
131104692906 
3814697265625 
17536397494 
762939453125 
1099511627776 


95367431640625 


0 
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152587890625 


90990301641624 


95367431640625 


92079356061924 


95367431640625 


93171895169474 


95367431640625 
9426792001 2849 


95367431640625 


1 
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et soit k = 30, 


La matrice M est la matrice définie par 


1 2147483644 82355164347672 2304195893041 83864 7404480207944222472 
1862645149230957031 25 186264514923095703125 37252902984619140625 37252902984619140625 7450580596923828125 
( 1 4294967292 123533390766601 2 36873722701817232 185342424787909745664 
931322574615478615625  931322574615478515625 931322574615478515625 74505805969238281 25 1862645149230957031 25 
0 0 1073741824 24706807002339 3457529170249198506 185572886554796103364 
931322574615478515625 37252902984619140625 931322574615478515625 1862645149230957031 25 
0 0 0 205891132094649 2305431226949504654 929016937497396916322 
931322574615478615625  931322574615478616625  931322574615478616626 
0 0 0 0 1152921 504606846976 930169653110871668649 
931322574615478515625  931322574615478515625 

0 0 0 0 0 1 


On constate que les coefficients des cinq premières colonnes sont de plus en plus faibles (on dirait 
qu’ils tendent vers 0), tandis que les coefficients de la dernière colonne tendent vers 1. C’est un 
résultat auquel on pouvait s’attendre : si le collectionneur a les moyens d’acheter autant de produits 
qu’il veut, on peut estimer qu’il finira par réunir la collection complète. 


c) Espérance du nombre d’achats nécessaires 


La variable aléatoire X dénombrant les achats à réaliser pour obtenir la collection complète peut être 
considérée comme la somme des variables aléatoires X; dénombrant chacune les achats à réaliser 
avant d’obtenir le k-ième objet distinct alors qu’on en a déjà acquis k-1 distincts. 


Soit Æ un entier non nul inférieur à n et soit j un entier naturel non nul. X, = j signifie qu’au j° 


achat, le client a acheté j — 1 produits contenant un aimantin au moins en double parmi les 4 — 1 déjà 
en sa possession et qu’il a obtenu un aimantin différent parmi les n —k +1 autres aimantins existants. 
On en déduit que : 


(k—1)/1(n-k+1) k—1\/T k-1 
P(Xx) mr. soit p(Xx = j) æ ( = D 
, : >:  n—-k+1 , . 
La variable X, suit la loi géométrique de paramètre —————. Son espérance mathématique est donc 
n 
n 
E(X, )}=—. 
1) n—-k+1 


La somme des espérances des variables X; est l’espérance de la variable X qui vaut donc : 


n n 


E(X)= 3 E(X,); ou encore E(X)= ÿ 


L 1 
————— , et, par changement d’indice : E(X )=n) —. 
= in k+i ) 2% 


En revenant au problème initial, on trouve que le collectionneur devra en moyenne acquérir 525 
produits pour compléter sa collection. 


Ressources :  http://euler.ac-versailles.fr/wm3/pi2/collection/collectionl.jsp 
http://euler.ac-versailles.fr/wm3/pi2/collection/collection2.jsp 
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4. Retour sur le modèle d’urnes de T. & P. Ehrenfest 
Etude du cas N > 2 


Certains résultats, trop complexes à prouver dans le cadre de cet enseignement de spécialité, sont 
énoncés. Ils sont destinés à sensibiliser les élèves aux résultats que l’on peut obtenir grâce à la 
puissance du calcul matriciel. 


Des références sont indiquées en fin de paragraphe pour permettre à ceux qui le souhaiteraient, à titre 
personnel, de mieux comprendre le phénomène. 


a) Le cadre général 


On note X, la variable aléatoire égale au nombre initial de boules dans l’urne B. 


À chaque instant n > 1, on tire au hasard, de façon équiprobable, un numéro entre 1 et N et on change 
d’urne la boule correspondante. 


Soit X, la variable aléatoire égale au nombre de boules dans l’urne B à l’instant n > 0. 


Ces variables aléatoires sont définies sur = [0, NI. 


L sij =i-1 
On a pour tout couple (i, j) de [0, N]2, (x - (Li=))s — sij=i+l. 
Osili- j|#1 


o L'état du processus à l’instant n + 1 ne dépend que de l’état du processus à l’instant n, c'est-à- 
dire du passé immédiat. Un tel processus est un processus Markovien. 


©  Px,=) (X u=j ) ne dépend pas de n. On dit que le processus est homogène. 


n 


o Notons p,, = P(x,=) (X =) ) et P la matrice carrée d’ordre N + 1 admettant les p,; pour 


coefficients. On a donc : 
N N 
pour tout j de [0, NT, P(X,u = 5)= D Per) (Ana = SX P(Xy =i)= D 5x p(X, =i) (D) 
i=0 i=0 


et 


0 1 O0 0 0 O0 O0 

£ GE 0 0 0 0 
N N 

D = À 2 0 0 0 

N N 

0 O0 À 0 0 0 O0 
P = al 

0 0 0 : V2 0 2 0 

N N 

0 0 O0 ……. O0 1 Q 1 

N N 

0 0 O0 0 .. O0 1 0 


P est appelée la matrice de transition du processus. 
Soit pour tout n, la matrice ligne Va = (P(Xx = 0) p(Xn = 1) … p(Xn = N)). 
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Pour tout entier n, V,,, =V,P (conséquence des relations (1) pour tout entier j de [0, NT), 


d’où V, =V,P". Il suffit donc de calculer P” pour estimer la répartition des boules dans les deux 
urnes. 


b) Exemple pour 4 boules 


0 1 0 O0 0 
1 0 i 0 0 
E={0;1;2;3;4}et P=|0 1 O0 ZT 0 
0 0 + 0 + 
0 0 0 1 O0 


3/4 1/2 1/4 
Graphe de transition : OX XX XX XX YO 
1/4 1/2 3/4 l 


À ÿ-# 0 à 
0 5 0 à 0 
CPS ER R 
0 3 0 5 0 
0 0 3 0 ! 


On suppose dans cet exemple qu’à l’état initial, toutes les boules sont dans l’urne A. On a donc 
Vo= (1 0 0 0 O). 


On obtient aisément = 0 +0 0): 
On obtient, à l’aide d’un logiciel de calcul formel : 
Gen) L ) Ge) (146 }x2 Gen) Gen) : | 
16 2% 4 2" 8 4 2" ie 
Ann APT À à à Afi 1 AL. 
(1-(-n (2) (1+(-D (+) (1-(-D = (1+(-0 (=) (1+(-) (+) 


P'= (en) (-cn'}= (rene (G-cn'}= (en) 


Avec V,=(1 0 0 O O), on obtient : 


1 1 1 1 3 1 1 1 1 
V _— j ' ")x ’ =D") —-— 
: ( ] —) ( “+ —) cs ») 8 ( a. e =) Ve L (= 27 ) 


16 
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Le nombre moyen de boules dans l’urne B au bout de n étapes est E(X,)=2- + Avec le temps, on 


aura en moyenne 2 boules dans chacune des urnes. 


c) Nombre moyen de boules dans l’urne B dans le cas général 


On démontre, en utilisant des espérances conditionnelles, que E(X,)= : + fi : + fE (Xo)- | 


(D.FOATA et A.FUCHS- Processus stochastiques, DUNOD) 


Dans le cas où N est supérieur à 2, E(X, à tend vers : . Cela signifie qu’avec le temps, il y aura à peu 


près autant de boules dans les deux compartiments. 


d) Temps de retour à un état initial K 


On peut également démontrer que le temps de retour moyen à l’état k (c’est à dire, partant de l’état de 
k boules dans l’urne B, on retourne pour la première fois à k boules dans l’urne B) est : 
2N 
My = — 
N 
k 


Le temps moyen de retour à l’état où l’urne B est vide est donc égal à 2". 


L’étude des chaines de Markov permet de prouver que l’urne retrouvera son état initial de façon quasi- 
certaine (résultat de Pierre BREMAUD en 1988 par application du critère de Foster à la matrice de 
transition). Cependant, si N est un multiple du nombre d’Avogadro, égal à 6,02.10°°, et que chaque 
transition se fait en une seconde, ce temps moyen est astronomique et quasiment infini à notre échelle. 
On n’observe donc pas de retour à l’état initial et cette « irréversibilité » est en grande partie due à la 
différence entre l’échelle de temps de l’observateur et celle du temps de retour. 


Ressource : SIMULATION DE L'URNE D'EHRENFEST Son apport à l'appropriation des concepts 
d'équilibre statistique, d'irréversibilité, d'entropie, de flèche du temps Alain Marie-Jeanne 1, Frédéric 
Beau 1, Michel Janvier 1 (2003) disponible sur http://hal.inria.fr. 


C. Suites liées par une relation non linéaire 
Le modèle proie-prédateur de Volterra 


Le mathématicien Volterra a proposé en 1926 un modèle décrivant l’évolution conjointe des sardines 
et des requins constatée par des pêcheurs de l’ Adriatique : les effectifs des deux espèces variaient de 
façon périodique en fonction du temps, avec la même période mais en étant décalées dans le temps. 


On considère deux populations dont les effectifs à l’instant f sont notés A(r) et B(t), qui désignent 
respectivement le nombre de proies et le nombre de prédateurs. 


On suppose qu’en l’absence de prédateurs, la population des proies aurait un taux d’accroissement 
constant positif noté a et qu’en l’absence de proies, la population des prédateurs aurait un taux 
d’accroissement constant négatif noté — d. 


On suppose de plus que lorsque les deux populations coexistent, l’effectif A(f) augmentera d’autant 
moins vite que B(t) sera grand et que l’effectif B(f) augmentera d’autant plus vite que A(f) sera 
grand. 
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Le modèle le plus simple est obtenu en supposant qu’il existe deux constantes positives b (quantité 
supposée constante de proies disparaissant par prédateur et par unité de temps, appelée « pression de 
prédation ») et c (quantité supposée constante de prédateurs « apparaissant » par proies et par unité de 
temps, appelée « accessibilité des proies ») telles que les coefficients d’accroissement par rapport au 
temps sont a —b B(t)et -d +c A(t). 


On aboutit ainsi au système (S) d’équations : 


dA 
FE A(t)(a—bB(t)) 


dB 
B(t)(-d +cA(f)) 


d4 — 
+ 4030) 


Un tel système est appelé système dynamique. On peut aussi s’écrire 


a “8 (40.80) 


On appelle trajectoire stationnaire du système tout couple de fonctions constantes (4*, B*) solution 
du système. 


1. Discrétisation 
Afin de « discrétiser » le problème, on décrit les populations à des instants successifs { et +6 à 
l’aide de deux suites (4, ) et (3,) de premiers termes À, et B; (effectifs à l’instant 0) et telles que 


pour tout entier n : 


Axe A, =ÔÀ, (a-bB,) 


n 


. À, = 4, (1+a'-b'B,) 
c’est-à-dire 
B,. : B, — Ô B, (-d + CA, ) n 


nH 
B,, =B,(1-d'+c'A,) 


n+l 


où a'=ôa,b'=ôb,c'=5ôc et d'=5d. 


a d : : : 
La valeur des rapports . et — reste inchangée ; seules les valeurs des coefficients a, b, c et d sont 
& 


modifiées. Dans la suite, on note à nouveau a, b, c et d les coefficients du système, et on s’intéresse 
donc à la résolution du système (S:) : 


qui fournit des résultats « satisfaisants » à condition de prendre des petites valeurs pour les coefficients 
a, b,cet d. 


On observe qu’en faisant varier les coefficients a, b, c et d, on peut obtenir des évolutions conjointes 
des deux populations très différentes. 

Les graphiques qui suivent représentent les évolutions simultanées des populations de proies et 
prédateurs. Ils sont obtenus à l’aide de la méthode d’Euler et réalisés avec le logiciel Matlab. Le 
nombre d’itération est 600, le pas égal à 1 et les données initiales sont 1000 proies et 50 prédateurs. 
Les graphiques bleus sont obtenus avec les coefficients a =0,05, b=0,002, 4 =0,04 et 
c=0,00004 et les graphiques rouges avec les coefficients a —0,05, b — 0,001, d = 0,04 et c = 


0,00002. 
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2. Recherche d’un équilibre 


A(t)(a-—bB(t))=0 
B()(-c+dA(1))=0 


Les effectifs des deux populations sont constantes si et seulement si 


Ceci donne deux couples de fonctions constantes correspondant à des trajectoires stationnaires : 


(4*,B*)= (0,0) et (4*,B*) -(£2) 


Par exemple, pour a = 0,05, b=0,001, d =0,02 et c = 0,00002 on obtient les valeurs suivantes 


Nombre de Proies = 1000, Nombre de Prédateurs = 50. 


Il est de plus possible de caractériser une trajectoire stationnaire, qui peut être stable si une petite 
perturbation de 4 ou de B est suivie d’un retour à (A*,B *) ou instable dans le cas contraire. Il est 


enfin possible de tracer le « portrait » du système dynamique en délimitant, dans le plan (4, B), les 
régions où les signes de 4’ et B' sont constants et en traçant les lieux des points où l’une des dérivées 
A' et B' est nulle. 


3. Linéarisation autour du point d’équilibre (d/c , a/b) 


À,1 = 4,(1+a-bB,) 


et on se place au voisinage du point d’équilibre 
B,1 = B,(1-d+c4,) 


On reprend le système (S:) 


en posant U, = À, ee et V =B, 
c 


bd 


Cabo Sp, 
C 


n+l 
On peut alors vérifier que le système (S.) équivaut au système 
V 


nl 


0e +. +cU,V. 


Si on se place au voisinage du point d’équilibre, le terme UV, peut être considéré comme 


nn 


bd 
Un me U, nn F, 
# je à x x A De C : 
négligeable et on peut approximer le système (S2) par le système linéaire qui se 
Fo = 58 + V, 
l bd 
è a ie C U, 
traduit matriciellement par = : 
Pi ac 1 F 
b 
l bd 
: C U, n U, 
Soit M = . On aura alors = M 
ac V V, 
Sn 1 n 
b 
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On peut étudier, à l’aide d’un logiciel et pour différentes valeurs de a, b, c et d, les puissances 
successives de la matrice M et les termes successifs des suites (U jet (V ) . 


n n 


On peut aussi revenir au système continu et se placer à nouveau au voisinage de la trajectoire 


stationnaire en posant A(+) = U(t) + Æ et B(t) = V (+) Fi. ë 
C 


DL y) HU (7 (n 
On peut alors vérifier que le système (S) s’écrit L . 
ac 
—=—U(t)-cU(t)V(t 
LU (eu (97 (9 
du __W,(, 
En négligeant cette fois-ci les termes en U (6) V (6), le système devient ue * 
0 À 


En dérivant à nouveau les deux équations du système on aboutit à U "(t)=-adU (6) et 


V"(t)=-adv (1). 


On admet qu’il existe donc des constantes a, B, y et Ô telles que, en notant ©@=Vad (a et d 
constantes positives par hypothèse), on ait: 
U(t)=acos(ot)+Bsin(or) et V(1)=ycos(or)+üsin(or). 
Cela justifie la périodicité observée expérimentalement dans le système proies-prédateurs, la période 
27 
Vad 


4. Modèle perturbé 


valant ici 


Pour rendre le modèle plus réaliste, on peut limiter les ressources alimentaires des proies, ce qui limite 
leur croissance. Il existe alors une constante # telle que le système dynamique s’écrive : 


— = A(f)(a—bB(t)-kA(6)) 
dB 
ae B(6)(-d + cA(f)) 


Les trajectoires stationnaires correspondent alors aux points d’équilibre (A*,B*) = (0,0) et 


ap [Le t) 
c b bc 
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En posant cette fois-ci A(t) = use et B(1) = P(+ LÉ et en négligeant encore les 
C ré 
“ ue U(6) : V (1) 
termes en U (#)V (6), on aboutit au système linéaire ° ° dont la matrice 
dy É d | 
- U(i) 
dé b b 
se 
associée est N = à F 
ac—kd 
0 
b 


On peut comme précédemment (à une ré-écriture des coefficients près) lui associer le système 
discrétisé linéarisé : 


C 
Fos T É }. F 
Dans le cas où a =0,05, b=0,001, d = 0,04 etc = 0,00004, le point d’équilibre non trivial est 
—1000k —] 
(4*,B*)=(1000,50-K#10°) et N = 
0,002-40k4 0 


On peut alors faire varier k et constater, sur le système discrétisé, que pour des valeurs très petites de k, 
le système converge vers le point d’équilibre, lorsque les valeurs initiales sont proches de ce point 
d’équilibre. 


Ressource : http://interstices.info/jcms/n_49876/des-especes-en-nombre?h|Text=volterra 
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IV. Annexe : utiliser Scilab pour numériser des images 


A. Les matrices 


1. Écriture 


Les matrices s’écrivent entre crochets [| |, en mettant des virgules entre les éléments d’une même 
ligne, et des points virgules entre les différentes lignes : 


M=1[0,0,1,1 ; 2,0,2,0 ; 1,1,1,1 | donne 0011 
2020 
1111 


zeros(2,4) donne une matrice de zéros avec 2 lignes et 4 colonnes. 


zones(3,4) donne une matrice de uns avec 3 lignes et 4 colonnes. 


2. Opérations 


Soient M1 et M2 deux matrices de même format : 


o MI + M2 donne la somme élément par élément ; 
o MI - M2 donne la différence élément par élément ; 
o  k*MI multiplie tous les éléments par le réel £ ; 


o MI1+Kkajoute le réel 4 à chaque élément. 
Soient M1 de format (m, n) et M2 de format (n , p): 


o MI1*M2 donne le produit des matrices. 


B. Les couleurs 
1. Principe du codage 


On utilise des matrices de nombres entre 0 et 1. À chaque élément de la matrice correspond un carré (pixel) 
colorié par une teinte de gris de sorte que plus le réel est proche de 1, plus le pixel dessiné est foncé. 


2. Affichage du dessin en 256 teintes de gris 


On définit la fonction affiche matrice qui transforme la matrice M de nombres entre 0 et 1 en une 
matrice de numéros de teintes entiers compris entre 0 et 255, dans laquelle 0 correspond au noir et 255 
correspond au blanc, et qui la dessine grâce à la fonction Scilab Matplot commentée ci-dessous. 


function affiche matrice(M) 
// Création d'une fenêtre graphique. 
= sciÛ); 
// On associe à la fenêtre graphique 256 teintes de gris. 
f. = graycolormap(255); 
// Fond de la fenétre blanc. 
f. = -); 
// Repère orthonormé. 
orthonorme; 
// On calcule (1-M) car dans la matrice M le 0 correspond au noir et le 1 au blanc, 
{on multiplie par 255 pour avoir des nombres entre 0 et 255, et on utilise la fonction 


// floor pour avoir des entiers. 
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Matplot(floor((1-M)*255)) 
// On enlève les axes. 


a = gca(); a. = ['off","'off","off"]; 
endfunction 


C. Les transformations 


Les codes Scilab correspondant à ces différentes fonctions et exemples sont fournis dans le paragraphe 
suivant. 


Des fonctions 


La fonction negatif donne le dessin en négatif. 

La fonction symetrique opère une symétrie d’axe vertical. 

La fonction somme permet de superposer des dessins. 

Les fonctions foncel et fonce2 permettent de foncer le dessin de deux façons différentes. 


Des exemples 


Les codes « Lettres » et « Poisson » donnent des exemples de dessins même si le poisson n’est pas très 
ressemblant. 


Le code « matrice aléatoire » permet de générer des matrices de grande dimension avec des éléments 
entre O et 1. 


D. Les codes Scilab 
Les fonctions proposées utilisent certaines fonctions du module « lycée » à télécharger. 


1. Pour afficher une matrice M 


function affiche matrice(M) 


= sciÛ); 

f. = graycolormap(255); 

f. = -); 

orthonorme; 

Matplot(floor((1-M)*255)) 

a = gca(); a. = ['off","'off","off"]; 
endfunction 


2. Opérations 
// Mise en négatif 


function MM=-negatif(M) 
MM = !-M; 

endfunction 

// Symétrique 


function MM-symetrique(M) 
t= taille(M); n =t(2); 


for i=l:n 
MM, = M(:n-i+l); 
end 
endfunction 
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// Somme 
function MM=-somme(M1, M2) 
MM = min(M1-+M2,ones(M1)); 


endfunction 


// Différence 

function MM-difference(M1, M2) 
MM = max(M1-M2,zeros(M1)); 

endfunction 


// Foncer en multipliant 
function MM-fonce1(M) 

MM = min(2*Mones(M)); 
endfunction 


// Foncer en ajoutant 
function MM=-fonce2(M, k) 

MM = min(M+k,ones(M)); 
endfunction 


// Lettres 
S=[0,0,0,0,0,0,0,0,0,0; 
0,0,0,0,0,0,0,0,0,0; 
0,0,0,1,1,1,1,0,0,0; 
0,0,0,1,0,0,0,0,0,0; 
0,0,0,1,0,0,0,0,0,0; 
0,0,0,1,1,1,1,0,0,0; 
0,0,0,0,0,0,1,0,0,0; 
0,0,0,0,0,0,1,0,0,0; 
0,0,0,1,1,1,1,0,0,0; 
0,0,0,0,0,0,0,0,0,0] 
L=[0,0,0,0,0,0,0,0,0,0; 
0,0,0,0,0,0.5,0,0,0,0; 
0,0,0,0,0,0.5,0,0,0,0; 
0,0,0,0,0,0.5,0,0,0,0; 
0,0,0,0,0,0.5,0,0,0,0; 
0,0,0,0,0,0.5,0,0,0,0; 
0,0,0,0,0,0.5,0.5,0.5,0.5,0; 
0,0,0,0,0,0,0,0,0,0; 
0,0,0,0,0,0,0,0,0,0; 
0,0,0,0,0,0,0,0,0,0;] 
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/ Affichage d'une matrice (N, N) avec T teintes 
N = 100; T = 200; 
M = Zeros(N,N; 


for i = 1:N 
M(i,:) = tirage entier(N,0,T-1)/(T-1); 
end 


affiche matrice(M); 


// Poisson 

P=[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; 
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; 
0,0,0,0,0,0,0,0,0,0,0.5,0,0,0,0,0,0,0,0,0; 
0,0,0,0,0,0,0,0,0,0.5,0.25,0.5,0,0,0,0,0,0,0,0; 
0,0,0,0,0,0,0,0,0,0.5,0.25,0.5,0,0,0,0,0.5,0.5,0,0; 
0,0,0,0,0,0,0,0,0.5,0.25,0.25,0.5,0,0,0,0.5,0.25,0.5,0,0; 
0,0,0,0,0,0,0,0,0.5,0.25,0.25,0.5,0,0,0,0.5,0.25,0.5,0,0; 
0,0,0,0,0,0,0.5,0.5,0,0,0.25,0.25,0.5,0.5,0.5,0.25,0.25,0.5,0,0; 
0,0,0,0,0,0.5,0.25,0,0.25,0.25,0.25,0.25,0.25,0.25,0.5,0.5,0.5,0,0,0; 
0,0,0,0,0.5,0.25,0,0.25,0.25,0.25,0.25,0.25,0.25,0.25,0.25,0.5,0.25,0.5,0,0; 
0,0,0,0.75,0.25,0,0.25,0.25,0.25,0.25,0.25,1,0.25,0.25,0.5,0.5,0.75,0.75,0,0; 
0,0,0.75,0.25,0,0.25,0.25,0.25,0.25,0.25,0.25,0.25,0.25,0.25,0.5,0.5,0.5,0.75,0,0; 
0,0,0.75,0.25,0.25,0.25,0.25,0.25,0.25,0.25,0.5,0.5,0.5,0.5,0.75,0.75,0.5,0.75,0,0; 
0,0,0,1,0.75,0.75,0.75,0.75,0.75,0.75,0.75,0.75,0.75,0.75,0.75,0.75,1,0,0,0; 
0,0,0,1,1,0.25,0.75,0.25,0.75,0.25,0.75,0.25,0.75,0.75,1,0.75,1,0,0,0; 
0,0,1,0.75,1,1,1,0.75,0.75,0.75,0.75,0.75,1,1,1,1,0.75,1,0,0; 
0,0,1,1,0,0,0,1,1,1,1,1,0,0,0,0,1,1,0,0; 

0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0; 

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0; 

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0] 
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